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Description 

[0001] La presents invention concerne de nouveaux polypeptides biologiquement actife, leur preparation et des 
compositions pharmaceutiques les contenant. 

5 [0002] Plus particulierement, la presente invention concerne des polypeptides recombinants essentiellement com- 
poses d'une partie active derivee d'un polypeptide, naturel ou artificiel, ayant une activity therapeutique, et couple a 
une albumine ou a un variant de l'albumine. II est entendu que I'activite therapeutique des polypeptides de Invention 
peut etre soit directe (traitement des maladies), ou indirecte (et par exemple utilisable dans la prevention des maladies, 
dans la conception des vaccins, dans les techniques de I'imagerie medicale etc.). 

10 [0003] II est entendu dans ce qui suit que les variants de I'albumine designent toute proteine a haute demie-vie 
plasmatique obtenue par modification (mutation, deletion et/ou addition) paries techniques du genie genetique d'un 
gene codant pour un isomorphe donne de la serum-album ine humaine, ainsi que toute macromolecule a haute demie- 
vie plasmatique obtenue par modification in vitro de la proteine codee par de tels genes. L'albumine etant tres poly- 
morphe, de nombreux variants naturels ont ete identifies et repertories [Weitkamp L.R. et al., Ann. Hum. Genet. 37 

15 (1973) 219]. 

[0004] Le but de la presente invention est d'elaborer des proteines artificielles biologiquement actives et utilisables 
sur le plan pharmaceutique. En effet, de nombreux polypeptides possedant une ou plusieurs activates therapeutiques 
potentielles ne peuvent etre expioites pharmaceutiquement Ceci peut avoir differentes raisons, telles que notamment 
leur faible stabilite in vivo, leur structure complexe ou fragile, la difficulty de les produire a une echelle industriellement 
20 acceptable, etc... De meme, certains polypeptides ne donnent pas les resultats attendus in vivo en raison de problemes 
d'administration, de conditionnement, de pharmacocinetique etc... 

[0005] EP 413 622 divulgue la fusion de CD4 soluble a l'albumine serique. WO 90/13653 divulgue certains compo- 
sants particuliers de fusion a l'albumine, pour les objectifs d'une secretion amelioree tout particulierement. WO 
89/02922 divulgue la fusion de CD4 soluble a une molecule apparentee du point de vue de sa structure, a savoir sa 
25 fusion a une chaTned'immunoglobulines (Ig). 

[0006] La presente invention permet de remedier a ces inconvenients. La presente invention fournit en effet de 

nouvelles molecules permettant une exploitation optimale sur le plan therapeutique des proprietes biologiques de ces 
polypeptides. La presente invention resulte notamment de la mise en evidence qu r il est possible de coupler geneti- 
quement toute structure active derivee d'un polypeptide biologiquement actif a une autre structure proteique constitute 

30 d'albumine, sans en alterer lesdites proprietes biologiques. Elle resulte egalement de la mise en evidence par la de- 
manderesse que la serum-albumine humaine permet de presenter efficacement la structure active a ses sites d'inte- 
raction, et qu'elle assure une stabilite plasmatique elevee du polypeptide de I'invention. Les polypeptides de invention 
permettent ainsi de maintenir dans I'organisme une activite biologique donnee pendant un temps prolonge. Ms permet- 
tent ainsi de reduire les doses administrees et, dans certains cas, de potentialiser I'effet therapeutique, par exemple 

35 en reduisant les effets secondares consecutife a une administration plus importante. Les polypeptides de I "invention 
permettent de plus de generer et d'utiliser des structures derivees des polypeptides biologiquement actifs tres petites 
et done tres specifiques d'un effet recherche. II est entendu que les peptides ayant une activite biologique presentant 
un interet therapeutique peuvent egalement correspondre a des sequences peptidiques non naturelles, isolees par 
exemple a partir de banques peptidiques aleatoires. Les polypeptides de Invention possedent par ailleurs une repar- 

40 tition particulierement avantageuse dans I'organisme, ce qui modifie leurs proprietes pharmacocinetiques et favorise 
le developpement de leur activite biologique et leur utilisation. En outre, ils presentent egalement I'avantage d'etre 
faiblement ou non-immunogeniques pour I'organisme dans lequel ils sont utilises. Finalement, les polypeptides de 
I'invention peuvent etre exprimes (et preferentiellement secretes) par des organismes recombinants, a des niveaux 
permettant leurs exploitation industrielle. 

45 [0007] Un objet de la presente invention concerne done des polypeptides comportant une partie active derivee d'un 
polypeptide ayant une activite therapeutique, couplee a une albumine ou a un variant de l'albumine. 
[0008] Dans un mode de realisation particulier, les peptides possedant une activite therapeutique ne sont pas d'ori- 
gine humaine. 

[0009] Plus particulierement, dans les molecules de I'invention, le polypeptide ayant une activite therapeutique est 
50 un polypeptide d'origine humaine ou un variant moleculaire. II s'agit de tout ou partie d'une hormone, d'un interferon, 
d'une interleukine, erythropoietine, G-CSF, ou I'insuline. 

[0010] La partie active des polypeptides de I'invention peut etre constitute, par exemple, par le polypeptide ayant 
une activite therapeutique entier, ou par une structure derivee de celui-ci, ou encore par un polypeptide non naturel 
isole a partir d'une banque peptidique. Au sens de la presente invention, on entend par structure denvee tout poly- 
55 peptide obtenu par modification et conservant une activite therapeutique. Par modification, on doit entendre toute 
mutation, substitution, deletion, addition ou modification de nature genetique et/ou chimique. De tels derives peuvent 
etre generes dans des buts differents, tels que notamment celui d'augmenter I'affinite de la molecule pour ses sites 
de fixation, celui d'ameliorer ses niveaux de production, celui d'augmenter sa resistances aux proteases, celui d'aug- 
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menter son efficacite therapeutique ou encore de reduire ses effets secondares, ou celui de lui conferer de nouvelles 
proprietes biologiques. A titre d'exemple, les polypeptides chimeres de I'invention possedent des proprietes pharma- 
cocinetiques et une activite biologique utilisable pour la prevention ou le traitement des maladies. 
[0011] Des polypeptides de Invention particulierement avantageux sont ceux dans lesquels la partie active 
5 presente : 

(a) la structure peptidique entiere ou, 

(b) une structure derivee de (a) par modification structural (mutation, substitution addition et/ou deletion d'un ou 
plusieurs residus) et possedant une activite therapeutique. 

10 

[0012] Parmi les structures du type (b), on peut citer plus particulierement les molecules dans lesquelles certains 
sites de N- ou O-glycosylation ont ete modifies ou supprimes, les molecules dans lesquelles un ou plusieurs residus 
ont ete substitues, ou les molecules dans lesquelles tous les residus cysteine ont ete substitues. On peut citer egale- 
ment des molecules obtenues a partir de (a) par deletion de regions n'intervenant pas ou peu dans Interaction avec 
15 les sites de .liaison consideres, ou exprimant une activite indesirable, et des molecules comportant par rapport a (a) 
des residus supplemental, tels que par exemple une methionine N-terminale et/ou un signal de secretion et/ou un 
peptide de jonction. 

[0013] La partie active des molecules de Tinvention peut etre couplee soit directement soit par I'intermediaire d'un 
peptide artificiel a I'albumine. De plus, elle peut constituer I'extremite N-terminale comme I'extremite C-terminale de 
20 la molecule. Preferentiellement, dans les molecules de ('invention, la partie active constitue la partie C-terminale de la 
chimere. II est egalement entendu que la partie biologiquement active peut etre redondante au sein de la chimere. 
Une representation schematique des molecules de invention est donnee a la Figure 1 . 

[0014] Un autre objet de invention concerne un procede de preparation des molecules chimeres decrites ci-avant. 
Plus precisement, ce procede consiste a faire exprimer par un note cellulaire eucaryote ou procaryote une sequence 
25 nucleotidique codant pour le polypeptide desire, puis a recolter le polypeptide produit. 

. J00.15] ... Parmi les notes eucaryotes utilisables dans le cadre de la presente invention, on peut citer les cellules ani- 
mates, les levures, ou les champignons. En particulier, s'agissant de levures, on peut citer les levures du genre Sac- 
charomyces, Kluyveromyces, Pichia, Schwanniomyces, ou Hansenula. S'agissant de cellules animales, on peut citer 
les cellules COS, CHO, C127, etc... Parmi les champignons susceptibles d'§tre utilises dans la presente invention, on 

30 peut citer plus particulierement Aspergillus ssp. ou Trichoderma ssp. Comme hotes procaryotes, on prefere utiliser les 
bacteries telles que Escherichia coli, ou appartenant aux genres Corynebacterium, Bacillus, ou Streptomyces. 
[0016] Les sequences nucleotidiques utilisables dans le cadre de la presente invention peuvent etre preparees de 
differentes manieres. Generalement, elles sont obtenues en assemblant en phase de lecture les sequences codant 
pour chacune des parties fonctionnelles du polypeptide. Celles-ci peuvent etre isolees par les techniques de I'homme 

35 de I'art, et par exemple directement a partir des ARN messsagers (ARNm) cellulaires, ou par reclonage a partir d'une 
banque d'ADN complementaire (ADNc), ou encore il peut s'agir de sequences nucleotidiques totalement synthetiques. 
1 1 est entendu de plus que les sequences nucleotidiques peuvent egalement etre ulterieurement modifiees, par exemple 
par les techniques du genie genetique, pour obtenir des derives ou des variants desdites sequences. 
[0017] Plus preferentiellement, dans le procede de I'invention, la sequence nucleotidique fait partie d'une cassette 

40 d'expression comprenant une region d'initiation de la transcription (region promoteur) permettant, dans les cellules 
hotes, I'expression de la sequence nucleotidique placee sous son controle et codant pour les polypeptides de I'inven- 
tion. Cette region peut provenir de regions promoteurs de genes fortement exprimes dans la cellule note utilisee, 
I'expression etant constitutive ou regulable. S'agissant de levures, il peut s'agir du promoteur du gene de la phospho- 
glycerate kinase (PGK), de la glyceraldehyde-3-phosphate dehydrogenase (GPP), de la lactase (LAC 4) , des enolases 

45 (ENO) , des alcools deshydrogenases (ADH) , etc... S'agissant de bacteries, il peut s'agir du promoteur des genes droit 
ou gauche du bacteriophage lambda (P L , P R ), ou encore des promoteurs des genes des operons tryptophane (P^) 
ou lactose (P lac ). En outre, cette region de controle peut §tre modifiee, par exemple par mutagenese in vitro , par 
introduction d'elements additionnels de controle ou de sequences synthetiques, ou par des deletions ou des substitu- 
tions des elements originels de controle. La cassette d'expression peut egalement comprendre une region de termi- 

50 naison de la transcription fonctionnelle dans I'hote envisage, positionnee immediatement en aval de la sequence nu- 
cleotidique codant pour un polypeptide de I'invention. 

[0018] Dans un mode prefere, les polypeptides de I'invention resultent de I'expression dans un note eucaryote ou 
procaryote d'une sequence nucleotidique et de la secretion du produit d'expression de ladite sequence dans le milieu 
de culture. II est en effet particulierement avantageux de pouvoir obtenir par voie recombinante des molecules direc- 
55 tement dans le milieu de culture. Dans ce cas, la sequence nucleotidique codant pour un polypeptide de I'invention 
est precedee d'une sequence "leader" (ou sequence signal) dirigeant le polypeptide naissant dans les voies de secre- 
tion de I'hote utilise. Cette sequence "leader" peut etre la sequence signal naturelle du polypeptide biologiquement 
actif dans le cas ou celui-ci est une proteine naturellement secretee, ou celle de la structure stabilisatrice, mais il peut 
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egalement s'agir de toute autre sequence "leader" fonctionnelle, ou d'une sequence "leader" artificielle. Le choix de 
I'une ou I'autre de ces sequences est notamment guide par I'hote utilise. Des exemples de sequences signal fonction- 
nelles incluent celles des genes des pheromones sexuelles ou des toxines "killer* de levures. 
[0019] En plus de la cassette d'expression, un ou plusieurs marqueurs permettant de selectionner I'hote recombine 
5 peuvent etre additionnes, tels que par exemple le gene URA3 de la levure S. cerevisiae, ou des genes conferant la 
resistance a des antibiotiques comme la geneticine (G418) ou a tout autre compose toxique comme certains ions 
metalliques. 

[0020] L'ensemble constitue par la cassette d'expression et par le marqueur de selection peut etre introduit directe- 
ment dans les cellules notes considerees, soit insere prealablement dans un vecteur autoreplicatif fonctionnel. Dans 

10 le premier cas, des sequences homologues a des regions presentes dans le gendme des cellules notes sont prefe- 
rentiellement additionnees a cet ensemble; lesdites sequences etant alors positionnees de chaque cote de la cassette 
d'expression et du gene de selection de facon a augmenter la frequence dlntegration de l'ensemble dans le genome 
de I'hote en ciblant integration des sequences par recombinaison homologue. Dans le cas ou la cassette d'expression 
est inseree dans un systeme replicatif, un systeme de replication prefere pour les levures du genre Kluyveromyces 

15 est derive du plasmide pKD1 initialement isole de K.drosophilarum; un systeme prefere de replication pour les levures 
du genre Saccharomyces est derive du plasmide 2\i de S. cerevisiae. De plus, ce plasmide d'expression peut contenir 
tout ou partie desdits systemes de replication, ou peut combiner des elements derives du plasmide pKD1 aussi bien 
que du plasmide 2u.. 

[0021] En outre, les plasmides d'expression peuvent etre des vecteurs navettes entre un note bactenen tel que 
20 Escherichia coli et la cellule note choisie. Dans ce cas, une origine de replication et un marqueur de selection fonc- 
tionnant dans I'hote bactenen sont requises. II est egalement possible de positionner des sites de restriction entourant 
les sequences bacteriennes et uniques sur le vecteur d'expression: ceci permet de supprimer ces sequences par 
coupure et religature in vitro du vecteur tronque avant transformation des cellules notes, ce qui peut resulter en une 
augmentation du nombre de copies et en une stabilite accrue des plasmides d'expression dans lesdits notes. Par 
25 exemple, de tels sites de restriction peuvent correspondre aux sequences telles que 5-GGCCNNNNNGGCC-3' (Sfil) 
ou 5: r GCGGCCGC-3' (Not!) dans la mesure ou ces sites sontextremement rares et generalement absents d'un vecteur 
d'expression. 

[0022] Apres construction de tels vecteurs ou cassette d'expression, ceux-ci sont introduits dans les cellules hotes 
retenues selon les techniques classiques decrites dans la litterature. A cet egard, toute methode permettant d'introduire 

30 un ADN etranger dans une cellule peut etre utilisee. II peut s'agir notamment de transformation, electroporation, con- 
jugaison, ou toute autre technique connue de I'homme de Part. A titre d'exemple pour les h6tes de type levure, les 
differentes souches de Kluyveromyces utilisees ont ete transformees en traitant les cellules entieres en presence 
d'acetate de lithium et de polyethylene glycol, selon la technique decrite par Ito et al. [J. Bacterid. 153 (1 983) 163]. La 
technique de transformation decrite par Durrens et al. [Curr. Genet 18 (1990) 7] utilisant I'ethylene glycol et le dime- 

35 thylsulfoxyde a egalement ete utilisee. II est aussi possible de transformer les levures par electroporation, selon la 
methode decrite par Karube et al. [FEBS Letters 182 (1985) 90]. Un protocole altematif est egalement decrit en detail 
dans les exemples qui suivent. 

[0023] Apres selection des cellules transformees, les cellules exprimant lesdits polypeptides sont inocul6es et la 
recuperation desdits polypeptides peut etre faite, soit au cours de la croissance cellulaire pour les precedes "en con- 
40 tinu", soit en fin de croissance pour les cultures "en lots" ("batch"). Les polypeptides qui font I'objet de la presente 
invention sont ensuite purifies a partir du surnageant de culture en vue de leur caracterisation moleculaire, pharma- 
cocinetique et biologique. 

[0024] Un systeme d'expression prefere des polypeptides de I'invention consiste en I'utilisation des levures du genre 
Kluyveromyces comme cellule h6te, transformees par certains vecteurs derives du replicon extrachromosomique pKD1 

45 initialement isole chez K. marxianus var. drosophilarum. Ces levures, et en particulier K. lactiset K. fragilis sont gene- 
ralement capables de repliquer lesdits vecteurs de facon stable et possedent en outre I'avantage d'etre mcluses dans 
la liste des organismes G.R.A.S. ("Generally Recognized As Safe"). Des levures privilegiees sont preferentiellement 
des souches industrielles du genre Kluyveromyces capables de repliquer de fa?on stable lesdits plasmides denves 
du plasmide pKD1 et dans lesquels a ete insere un marqueurde selection ainsi qu'une cassette d'expression permettant 

50 la secretion a des niveaux §leves des polypeptides de Invention. 

[0025] La presente invention concerne egalement les sequences nucleotidiques codant pour les polypeptides chi- 
meres decrits ci-avant, ainsi que les cellules recombinantes, eucaryotes ou procaryotes, comprenant de telles sequen- 
ces. 

[0026] La presente invention concerne aussi Implication a titre de medicament des polypeptides selon la presente 
55 invention. Plus particulierement, Invention a pourobjet toute composition pharmaceutique comprenant un ou plusieurs 
polypeptides ou sequences nucleotidiques tels que decrits ci-avant. Les sequences nucleotidiques peuvent en effet 
etre utilisees en therapie genique. 

[0027] La presente invention sera plus completement decrite a I'aide des exemples qui suivent, qui doivent etre 
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consideres comme illustratifs et non limitatifs. 
LISTE PES FIGURES 

5 [0028] Les representations des plasmides indiquees dans les Figures suivantes ne sont pas tracees a I'echelle et 
seuls les sites de restriction importants pour ta comprehension des clonages realises ont ete indiques. 

Figure 1 : Schematisation des chimeres du type SAH-PEPTIDE (A), du ype PEPTTDE-SAH (B) ou PEPTI- 
DE-SAH-PEPTIDE (C). Abrogations utilisees : M/LP, residu methionine initiateurde la traduction, eventuellement 
10 suivied'une sequence signal de secretion; SAH, al bum ine mature ou un deses variants moleculaires; PER peptide 

d'origine naturelle ou artificielle possedant une propriete therapeutique donnee. La sequence PEP peut etre pre- 
sente plusieurs fois dans les molecules de type A, B ou C. La fleche noire indique I'extremite N-terminale de la 
proteine mature. 

15 SEQ ID n° 1: Exemples de sequences nucleotidiques d'un fragment de restriction Hindlll codant pour une 

proteine chimere du type prepro-SAH-PEPTIDE. Lesfleches noires indiquent la fin des regions "pre" et "pro" 
de la SAH. Le site de restriction Mstll est souligne et le codon specifiant la terminaison de la traduction est 
en caracteres gras. 

20 Figure 3 : Carte de restriction du plasmide pYG105 et strategie generique de construction des plasmides de- 

pression des proteines chimeres de la presente invention. Abreviations utilisees : P, promoteur transcriptionnel ; 
T, terminateur transcriptionnel ; IR, sequences repetees inversees du plasmide pKD1 ; LP, sequence signal de 
secretion ; Ap r et Km r designentrespectivement les genes de resistance a I'ampicilline (E. coli) et au G418 (levu- 
res). 

25 

Figured: Exemples de sequences nucleotidiques de fragments de restriction Mstll-Hindlll derives du facteur von 

Willebrand. Representation de la structure des fragments Mstll -Hind lll des plasmides pYG1248 (panneau A), 
pYG1214 (panneau B), pYG1206 [panneau C, dans cette chimere particuliere le residu Leu694 du vWF est ega- 
lement le dernier residu (Leu585) de la SAH] et pYG1223 (panneau D) ; la numerotation des acides amines cor- 
30 respond a la numerotation du vWF mature d'apres Titani et al. [Biochemistry 25 (1986) 3171-3184]. Les sites de 

restriction Mstll et Hind lll sont soulignes et le codon de terminaison de la traduction est en caracteres gras. SEQ 
ID n° 2 : sequence nucleotidique du fragment de restriction Mstll -Hind lll du plasmide pYG1248. La numerotation 
des acides amines (colonne de droite) correspond a la proteine chimere SAH-vWF470->71 3 mature (829 n§sidus). 
Les residus Thr470, Leu494, Asp498, Pro502, Tyr508, Leu694, Pro704, et Pro708 du vWF mature sont soulignes. 

35 

Figure 5 : Caracterisation du materiel secrete apres 4 jours de culture (erlenmeyers) de la souche CBS 293.91 
transformee par les plasmides pYG1248 (plasmide dexpression d'une chimere du type SAH-vWF 
Thr470->Val713) et pKan707 (plasmide controle). Dans cette experience les resultats des panneaux A, B, et C 
ont ete migres sur le meme gel (SDS-PAGE 8,5 %) puis traites separemment. 

40 

A, coloration au bleu de coomassie; standard de poids moleculaire (piste 2); sumageant equivalent a 50 ul 
de la culture transformee par les plasmides pKan707 en milieu YPL (piste 1), ou pYG1248 en milieu YPD 
(piste 3) ou YPL (piste 4). 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps de souris diriges contre le 
45 vWF humain: meme legende qu'en A a I'exception que des standards biotiniles de poids moleculaire ont ete 

utilises. 

C, caracterisation immunologique du materiel secrete apres utilisation d'anticorps de lapin diriges contre I'al- 
bumine humaine: surnageant equivalent a 50 \i\ de la culture transformee par les plasmides pKan707 en milieu 
YPL (piste 1), ou pYG1248 en milieu YPD (piste 2) ou YPL (piste 3). 

50 

Figure 6 : Cinetique de secretion d'une chimere de invention par la souche CBS 293.91 transformee par le plas- 
mide pYG1206 (SAH-vWF Leu694-Pro708). 

A, coloration au bleu de coomassie ; standard de poids moleculaire (piste 1) ; sumageant equivalent a 2,5 ul 
55 d'une culture "Fed Batch" en milieu YPD apres 24h. (piste 2), 40h. (piste 3) ou 46h. (piste 4) de croissance. 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps de souris diriges contre le 
vWF humain : meme legende qu'en A a I'exception que des standards biotiniles de poids moleculaire ont ete 
utilises. 
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Figure 7 : Caracterisation du materiel secrete par K. lactis transforme par les plasmides pKan707 (plasmide con- 
trole, piste 2), pYG1206 (piste 3), pYG1214 (piste 4) et pYG1223 (piste 5) ; standard de poids moleculaire (piste 
1). Les depots correspondent a 50 nl de surnageant d'une culture stationnaire apres croissance en milieu YPD, 
migration dans un gel a 8.5 % d'acrylamide et coloration au bleu de coomassie. 

SEQ ID n° 3: Sequence nucleotidique du fragment de restriction Mstll-Hindlll du plasmide pYG1341 
(SAH-UK1->135). La limite du domaine EGF-like (UK1->46) present dans le fragment de restriction Mstll- 
Hind lll du plasmide pYG1340 est indiquee. La numerotation des acides amines correspond a la proteine 
chimere SAH-UK1->135 mature (720 residus). 

Figure9 : Secretion des chimeresSAH-UK1 -46 etSAH-UK1- 135 par la souche CBS 293.91 respectivement trans- 
formee par les plasmides pYG1343 (SAH-UK1-46) et pYG1345 (SAH-UK1-135), apres 4 jours de croissance (mi- 
lieu YPL+G418). Les depots (equivalents a 50 *il de culture) sont migres en gel PAGE-SDS a 8,5 % et colores au 
bleu de coomassie: surnageant d'un clone transforme par les plasmides pKan707 (piste 1), pYG1343 (piste 3) ou 
pYG1345 (piste 4) ; standard de poids moleculaire (piste 2). 

SEQ ID n° 4 : Sequence nucleotidique du fragment de restriction Mstll- Hind lll du plasmide pYG1 259 (SAH-G. 
CSF). La limite de la partie G-CSF (174 residus) est indiquee. Les sites de restriction Apal et Sstl (Sstl) sont 
soulignes. La numerotation des acides amines correspond a la proteine chimere SAH-G.CSF mature (759 
residus). 

SEQ ID n° 5 : Sequence nucleotidique du fragment de restriction Hind lll du plasmide pYG1301 (chimere G. 
CSF-GJy 4 -SAH). Les fleches noires indiquent la fin des regions "pre" et "pro" de la SAH. Les sites de restriction 
Apa l, Sst l (Sad ) et Mstl I sont soulignes. Les domaines G.CSF (1 74 residus) et SAH (585 residus) sont separes 
par le linker synthetique GGGG. La numerotation des acides amines correspond a la proteine chimere G. 
. CSF-Gly4-SAH mature (763 residus). La sequence nucleotidique comprise entre le codon de terminaison de 
la traduction et le site Hind lll provient de I'ADN complements re (cDNA) de la SAH tel que decrit dans la 
demande de brevet EP 361 991 . 

Figure 12 : Caracterisation du materiel secrete apres 4 jours de culture (erienmeyers) de la souche CBS 293.91 
transformee par les plasmides pYG1 266 (plasmide d'expression d'une chimere du type SAH-G.CSF) et pKan707 
(plasmide controle). Dans cette experience les resultats des panneaux A, B, et C ont ete migres sur le meme gel 
(SDS-PAGE 8,5 %) puis traites separemment. 

A, coloration au bleu de coomassie; standard de poids moleculaire (piste 2) ; surnageant equivalent a 100 jil 
de la culture transformee par les plasmides pKan707 en milieu YPL (piste 1), ou pYG1266 en milieu YPD 
(piste 3) ou YPL (piste 4). 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps primaires diriges contre le 
G-CSF humain : meme legende qu'en A. 

C, caracterisation immunologique du materiel secrete apres utilisation d'anticorps primaires diriges contre 
I'albumine humaine : meme legende qu'en A. 

Figure 1 3 : Caracterisation du materiel secrete apres 4 jours de culture (erienmeyers en m ilieu YPD) de la souche 
CBS 293.91 transformee par les plasmides pYG1267 (chimere SAH-G.CSF), pYG1303 (chimere G. 
CSF-Gly 4 -SAH) et pYG1352 (chimere SAH-Gly 4 -G.CSF) apres migration sur gel SDS-PAGE 8,5 %. 

A, coloration au bleu de coomassie ; surnageant equivalent a 1 00 ul de la culture transformee par les plasmides 
pYG1303 (piste 1), pYG1267 (piste 2) ou pYG1352 (piste 3); standard de poids moleculaire (piste 4). 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps primaires diriges contre le 
G-CSF humain : meme legende qu'en A. 

SEQ ID n° 6: Sequence nucleotidique du fragment de restriction Mstll -Hind lll du plasmide pYG1382 
(SAH-Fv*). Les domaines VH (124 residus) et VL (107 residus) du fragment Fv' sont separes par le linker 
synthetique (GGGGS)^. La numerotation des acides amines correspond a la proteine chimere SAH-Fv' ma- 
ture (831 residus). 

Figure 15 : Secretion de la chimere SAH-Fv' par la souche CBS 293.91 transformee par le plasmide pYG1383 
(LAC4) apres 4 jours de croissance en erienmeyers a 28°C en milieu YPD (piste 2), ou YPL (piste 3) ; standard 
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de poids moleculaire (piste 1). Les depots, Equivalents a 200 nl de culture (precipitation a I'ethanol), sont migres 
en gel PAGE-SDS (8,5 %). 

A, : coloration du gel au bleu de coomassie. 
5 B, : caracterisation immunologique du materiel secrete aprds utilisation d'anticorps primaires diriges contre 

la SAH. 

Figure 16 : Dosage de I'activite antagoniste in vitro de I'agglutination des plaquettes humaines fixees au 
formaldehyde : CI50 des hybrides SAH-vWF694-708, [SAH-vWF470-713 C471G, C474G] et [SAH-vWF470-704 
10 C471G, C474G] relativement a I'etalon RG 12986. La determination de I'inhibition dose-d6pendante de I'aggluti- 

nation plaquettaire est realisee selon la methode decrite par C. Prior et al. [BioHechnology (1992) 10 66] en utilisant 
un agregametre enregistrant les variations de la transmission optique sous agitation a 37°C en presence de vWF 
humain, de botrocetine (8,2 mg/ml) et du produit a tester a ditferentes dilutions. La concentration du produit qui 
permet d'inhiber de moitie ['agglutination controle (en I'absence de produit) est alors determinee (CI50). 

15 

Figure 1 7 : Activity sur la proliferation cellulaire in vitro de la lign§e murine NFS60. La radioactivite pH-thymidine) 
incorporee dans les noyaux cellulaires aprfcs 6 heures d'incubation est representee en ordonnee (cpm) ; la quantite 
de produit indiquee en abscisse est exprimee en molarite (unites arbitrages). 

20 Figure 18 : Activite sur la granulopoiese in vivo chez le rat. Le nombre de neutrophiles (moyenne de 7 animaux) 

est indiquee en ordonnee en fonction du temps. Les produits testes sont la chimere SAH-G.CSF (pYG1266, 4 ou 
40 mg/rat/jour), le G-CSF reference (10 mg/rat/jour), la SAH recombinante purifiee a partir de sumageant de 
Kluyveromyces lactis (SAH, 30 mg/rat/jour, cf. EP 361 991), ou du serum physiologique. 

25 EXE MP LES 

TECHNIQUES GENERALES DE CLONAGE 

[0029] Les methodes classiquement utilisees en biologie moleculaire telles que les extractions preparatives d'ADN 
30 plasmidique, la centrifugation d'ADN plasmidique en gradient de chlorure de cesium , reiectrophorese sur gels d'aga- 
rose ou d'acrylamide, (a purification de fragments d'ADN par electrocution, les extraction de proteines au phenol ou 
au phenol-chloroforme, la precipitation d'ADN en milieu salin par de I'ethanol ou de I'isopropanol, la transformation 
dans Escherichia coli etc ... sont bien connues de I'homme de metier et sont abondament decrites dans la litterature 
[Maniatis T. et al., "Molecular Cloning, a Laboratory Manual", Cold Spring Harbor Laboratory, Cold Spring Harbor, N. 
35 Y, 1982 ; Ausubel F.M. et al. (eds), "Current Protocols in Molecular Biology", John Wiley & Sons, New York, 1987]. 
[0030] Les enzymes de restriction ont ete foumies par New England Biolabs (Biolabs), Bethesda Research Labo- 
ratories (BRL) ou Amersham et sont utilisees selon les recommandations des fournisseurs. 

[0031] Les plasmides de type pBR322, pUC et les phages de la serie M13 sont d'origine commerciale (Bethesda 
Research Laboratories). 

40 [0032] Pour les ligatures, les fragments d'ADN sont separes selon leur taille par eiectrophordse en gels d'agarose 
ou d'acrylamide, extraits au phenol ou par un melange phenol/chloroforme, precipites a I'ethanol puis incubes en 
presence de I'ADN ligase du phage T4 (Biolabs) selon les recommandations du foumisseur. 
[0033] Le remplissage des extremites 5' proeminentes est effectue par le fragment de Klenow de I'ADN Polymerase 
I d' E. coli (Biolabs) selon les specifications du foumisseur. La destruction des extremites 3' proeminentes est effectuee 

45 en presence de I'ADN Polymerase du phage T4 (Biolabs) utilise selon les recommandations du fabricant. La des- 
truction des extremites 5' proeminentes est effectuee par un traitement menage par la nuclease S1 . 
[0034] La mutagenese dirig6e in vitro par oligodeoxynucieotides synthetiques est effectuee selon la methode deve- 
Joppee par Taylor et al. [Nucleic Acids Res. 13 (1985) 8749-8764] en utilisant le kit distribu6 par Amersham. 
[0035] ^amplification enzymatique de fragments d'ADN par la technique dite de PCR [Polymerase-catalyzed Chain 

so Reaction, Saiki R.K. et al., Science 230 (1985) 1350-1354; Mullis K.B. et Falcona FA, Meth. Enzym. 155 (1987) 
335-350] est effectuee en utilisant un "DNA thermal cycler" (Perkin Elmer Cetus) selon les specifications du fabricant 
[0036] La verification des sequences nucieotidiques est effectuee par la methode developpee par Sanger et al . [Proc. 
Natl. Acad. Sci. USA, 74 (1977) 5463-5467] en utilisant le kit distribu6 par Amersham. 

[0037] Les transformations de K. lactis a vec I'ADN des plasmides d'expression des proteines de la presente invention 
55 sont effectuees par toute technique connue de I'homme de I'art, et dont un exemple est donne dans le texte. 

[0038] Sauf indication contraire, les souches bacteriennes utilisees sont E. coli MC1060 (laclPOZYA, X74, galU, 

cjalK, strAO, ou E. coli TG1 (lac, proA,B, sup E, thi, hsdDS / FtraD36, praA + B + , lacH, lacZ, M15). 

[0039] Les souches de levures utilisees appartiennent aux levures bourgeonnantes et plus particulidrement aux 
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levures du genre Kluyveromyces. Les souche K. lactis MW98-8C (a, uraA, arg, lys, K + , pKD1°) et K. lactis CBS 293.91 
ont ete particulierement utilisees; un echantillon de la souche MW98-8C a ete depose le 16 Septembre 1988 au Cen- 
traalbureau voor Schimmelkulturen (CBS) a Baarn (Pays Bas) ou il a ete enregistre sous le numero CBS 579.88. 
[0040] Une souche bacterlenne (E. coli) transformee avec le plasmide pET-8c52K a ete deposee le 17 Avril 1990 
5 aupres de I'American Type Culture Collection sous le numero ATCC 68306. 

[0041] Les souches de levures transformees par les plasmides d'expression codant pour les proteines de la presente 
invention sont cultivees en erlenmeyers ou en fermenteurs pilotes de 21 (SETRIC, France) a 28°C en milieu riche 
(YPD: 1% yeast extract, 2% Bactopeptone, 2% glucose; ou YPL: 1% yeast extract, 2% Bactopeptone, 2% lactose) 
sous agitation constante. 

10 

EXEMPLE 1 : COUPLAGE EN C-TERMINAL DE LA SAH 

[0042] Le plasmide pYG404 est decrit dans la demande de brevet EP 361 991 . Ce plasmide comporte un fragment 
de restriction Hind lll codant pour le gene de la prepro-SAH precede des 21 nucleotides naturellement presents imme- 

15 diatement en amont de I'ATG initiateur de traduction du gene PGK de S. cerevisiae. La sequence nucleotidique de ce 
fragment de restriction est incluse dans la sequence ID n° 2. Le site Mstll localise dans la sequence codante, a trois 
residus du codon specifiant la fin de traduction est particulierement utile comme site de clonage d'un peptide biologi- 
quement actif que Ton desire coupler en phase traductionnelle en C-terminal de la SAH. Dans un mode de realisation 
particulier, il est utile d'utiliser des peptides dont la sequence est codee par un fragment de restriction Mstll -Hind lll du 

20 type : 5' -CCTTAGGCTTA [3xN1p TAAGCTT-3', la sequence codant le peptide (p residus) biologiquement actif est [3xN] 
p). La ligature de ce fragment avec le fragment de restriction Hind lll-Mstll correspondant a la totalite du gene codant 
pour la SAH a I'exception des trois acides amines les plus C-terminaux (residus leucine-glycine-leucine) genere un 
fragment de restriction Hind lll comportant un gene hybride codant pour une proteine chimere du type SAH-PEPTIDE 
(Figure 1, panneau A), immediatement precedee de la region d'exportation "prepro" de la SAH. Dans un autre mode 

25 de realisation, le peptide biologiquement actif peut etre present plus d'une fois dans la chimere. 

EXEMPLE 2: COUPLAGE EN N-TERMINAL DE LA SAH 

[0043] Dans un mode realisation particulier, les techniques combinees de mutagenese dirigee et ^amplification PCR 
30 permettent de construire des genes hybrides codant pour une proteine chimere resultant du couplage traductionnel 
entre un peptide signal (et par exemple la region prepro de la SAH), une sequence incluant le peptide biologiquement 
actif et la forme mature de la SAH ou un de ses variants moleculaires. Ces genes hybrides sont preferentiellement 
bordes en 5' de I'ATG initiateur de traduction et en 3' du codon de fin de traduction par des sites de restriction Hind lll 
et codent pour des proteines chimeres du type PEPTIDE-SAH (Figure 1 , panneau B). Dans un mode realisation encore 
35 plus particulier, le peptide biologiquement actif peut etre present plus d'une fois dans la chimere. 

EXEMPLE 3: COUPLAGE EN N-ET C-TERMINAL DE LA SAH 

[0044] Les techniques combinees de mutagenese dirigee et d'amplification PCR decrites dans les exemples 1 et 2 
40 permettent de construire des genes hybrides codant pour une proteine chimere resultant du couplage traductionnel 
entre la forme mature de la SAH, ou un de ses variants moleculaires, et un peptide biologiquement actif couple aux 
extremites N- et C-terminales de la SAH. Ces genes hybrides sont preferentiellement bordes en 5' de I'ATG initiateur 
de traduction et en 3' du codon de fin de traduction par des sites de restriction Hindlll et codent pour des proteines 
chimeres du type PEPTI DE-SAH-PEPTI DE (Figure 1 , panneau C), immediatement precedeesde la region d'exporta- 
45 tion "prepro" de la SAH. Dans un mode realisation encore plus particulier, le peptide biologiquement actif peut §tre 
present plus d'une fois dans la chimere. 

EXEMPLE 4 : PLASMIDES D'EXPRESSION 

50 [0045] Les proteines chimeres des exemples precedents peuvent etre exprimees dans les levures a partir de pro- 
moteurs fonctionnels, regulables ou constitutife, tels que, par exemple, ceux presents dans les plasmides pYG105 
(promoteur LAC 4 de Kluyveromyces lactis) , pYG1 06 (promoteur PGK de Saccharomyces cerevisiae) , pYG536 (pro- 
moteur PHQ 5 de S. cerevisiae) , ou des promoteur hybrides tels que ceux decrits dans la demande de brevet EP 361 
991 . Les plasmides pYG 1 05 et pYG1 06 sont ici particulierement utiles car iis permettent I'expression des genes codes 

55 par les fragments de restriction Hind lll tel que decrits dans les exemples precedents et clones dans le site Hind lll et 
dans I'orientation productive (definie comme I'orientation qui place la region "prepro" de I'albumine de facon proximale 
par rapport au promoteur de transcription), a partir de promoteurs fonctionnels chez K.lactis, regulables (pYG105) ou 
constitutifs (pYG106). Le plasmide pYG105 correspond au plasmide pKan707 decrit dans la demande de brevet EP 
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361 991 dans lequel le site de restriction Hind i 1 1 unique et localise dans le gene de resistance a la gen&icine (G418) 
a ete detruit par mutagenese dirigee tout en conservant une proline inchangee (oligodeoxynucleotide 5'-GAAATGCA- 
TAAG CTCTTGCCATTCTCACCG-3') . Le fragment Sall-Sacl codant pourlegeneURA3 du plasmide mute a 6t§ ensuite 
remplace par un fragment de restriction Sall-Sacl comportant une cassette d'expression constituee du promoteur LAC4 
5 de K. lactis (sous la forme d'un fragment Sail -Hindi 1 1) et du terminateur du gene PGK de S. cerevisiae (sous la forme 
d'un fragment Hindlll-Sacl). Le plasmide pYG105 est mitotiquement tres stable chez les levures Kluyveromyces et 
une carte de restriction en est donnee a la Figure 3. Les plasmides pYG105 et pYG106 ne different entre eux que par 
la nature du promoteur de transcription encode par le fragment Sall -Hind lll. 

10 EXEMPLE 5 : TRANSFORMATION DES LEVURES 

[0046] La transformation des levures appartenant au genre Kluyveromyces, et en particulier les souches MW98-8C 
et CBS 293.91 de K. lactis, s'effectue par exemple par la technique de traitement des cellules entieres par de I'acetate 
de lithium [Ito H. et al., J. Bacterid. 153 (1983) 163-168], adaptee com me suit. La croissance des cellules se fait a 

15 28°C dans 50 ml de milieu YPD, avec agitation et jusqu'a une densite optique a 600 nm (DOeoo) comprise entre 0,6 
et 0,8; les cellules sont recoltees par centrifugation a faible vitesse, lavees dans une solution sterile de TE (10 mM 
Tris HCI pH 7,4; 1 mM EDTA), resuspendues dans 3-4 ml d'acetate lithium (0,1 M dans du TE) pour obtenir une densite 
cellulaire d'environ 2 x 10 8 cellules/ml, puis incubees a 30°C pendant 1 heure sous agitation modeYee. Des aliquotes 
de 0,1 ml de la suspension resultante de cellules competentes sont incubes a 30°C pendant 1 heure en presence 

20 d'ADN et a une concentration finale de 35% de polyethylene glycol (PEG^qo, Sigma). Apres un choc thermique de 5 
minutes a 42°C, les cellules sont lavees 2 fois, resuspendues dans 0,2 ml d'eau sterile et incubees 16 heures a 28°C 
dans 2 ml de milieu YPD pour permettre I'expression phenotypique du gene de resistance au G418 exprim6 sous 
controle du promoteur P k1 (cf. EP 361 991); 200 |xl de la suspension cellulaire sont ensuite etales sur boites YPD 
selectives (G418, 200 fig/ml). Les boites sont mises a incuber a 28°C et les transformants apparaissent apres 2 a 3 

25 jours de croissance cellulaire. 

EXEMPLE 6 : SECRETION DES CHIMERES 

[0047] Apres selection sur milieu riche supplements en G418 les clones recombinants sont testes pour leur capacite 
30 & secreter la forme mature des proteines chimeres. Quelques clones correspondant a la souche CBS 293.91 ou 
MW98-8C transformed par les plasmides d'expression des chimeres entre la SAH et la parte biologiquement active 
sont mis a incuber en milieu YPD ou YPL a 28°C. Les sumageants cellulaires sont recuperet par centrifugation quand 
les cellules atteignent la phase stationnaire de croissance, eventuellement concentres 1 0 fois par precipitation pendant 
30 m inutes a -20°C dans une concentration fi nale de 60% d'ethanol, puis testes apres electrophorese en gel SDS-PAG E 
35 a 8.5%, soit directement par coloration du gel par du bleu de coomassie, soit apres im m unoblot en utilisant des anticorps 
primaires diriges contre la parte biologiquement active ou un s6rum polyclonal de lapin dirige centre la SAH. Lors des 
experiences de detection immunologique, le filtre de nitrocellulose est d'abord incube en presence des anticorps pri- 
maires specifiques, lave plusieurs fois, incube en presence d'anticorps de chevre diriges contre les anticorps primaires, 
puis incube en presence d'un complexe avidine-peroxydase en utilisant le "kit ABC" distribue par Vectastain (Biosys 
40 S.A., Compiegne, France). La reaction immunologique est ensuite revelee par addition de diamino-3,3' benzidine te- 
trachlorydrate (Prolabo) en presence d'eau oxygenee, selon les recommandations du fabricant. 

EXEMPLE 7 : CHIMERES DERIVEES DU FACTEUR VON WILLEBRAND 

45 E.7.1. Fragments antagonistes de la fixation du vWF aux plaquettes. 

E.7.1.1. Residus Thr470-Val713 du vWF. 

[0048] Le plasmide pET-8c52K comporte un fragment du cDNA du vWF codant pour les residus 445 a 733 du vWF 
50 humain et inclus done plusieurs determinants cruciaux de llnteraction entre le vWF et les plaquettes d'une part, et 
certains elements de la membrane basale et du tissu sous-endothelial d'autre part, et notamment les peptides G10 et 
D5 antagonistes de interaction entre vWF et GP1b [Mori H. et al., J. Biol. Chem. 263 (1988) 17901-17904]. Cette 
sequence peptidique est identique a la sequence con-espondante decrite par Titani et al. [Biochemistry 25 (1986) 
3171-3184]. ^amplification de ces determinants g6n6tiques peut etre realisee a partir du plasmide pET-8c52K, par 
55 exemple par la technique d'amplification PGR, en utilisant comme amorce des oligodeoxynucleotides codant pour des 
residus contigus localises de part et d'autres de la sequence a amplifier. Les fragments amplifies sont ensuite clones 
dans des vecteurs du type M13 en vue de leur verification par sequencage en utilisant soit les amorces universelles 
situees de part et d'autre du multisite de clonage, soit des oligodeoxynucleotides specifiques de la region amplifiee du 
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gene du vWF dont la sequence de plusieurs isomorphes est connue [Sadler J.E. et al, Proc. Natl. Acad. Sci. 82 (1985) 
6394-6398; Verweij C.L et al., EMBO J. 5 (1986) 1839-1847; Shelton-lnloes B.B. et al., Biochemistry 25 (1986) 
3164-3171 ; Bonthron D. et al, Nucleic Acids Res. 17 (1986) 7125-7127]. Ainsi, I'amplification PCR du plasmide pET- 
8c52K avec les oligodeoxynucleotides 5'-CCCGGGAT CCCTTAGG CTTAACCTGTGAAGCCTGC-3' (Sq1969, le site 

5 Mstll est souligne) et 5'-CCCGGGATCCAAGCTTAGACTTGTGCCATGTCG-3' (Sq2029, le site Hindlll est souligne) 
genere un fragment de restriction Mstl l-Hindll I incluant les residus Thr470 a Val71 3 du vWF (SEQ ID n° 2). La ligature 
de ce fragment avec le fragment de restriction Hind lll-Mstll correspondant a la totalite du gene codant pour la SAH a 
I'exception des trois acides amines les plus C-terminaux (cf. SEQ ID n° 1) gendre un fragment de restriction Hindlll 
comportant un g&ne hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1, panneau A), imme- 

10 diatement precedee de la region d'exportation "prepro" de la SAH. Ce fragment de restriction est clone dans I'orientation 
productive et dans le site Hindlll du plasmide pYG105, ce qui g6n6re le plasmide d'expression pYG1248 (SAH- 
VWF470-713). 

E.7.1. 2. Variants moleculaires. 

15 

[0049] Dans un autre mode de realisation, le site de liaison du vWF est un peptide incluant les residus Thr470 a 
Asp498 du vWF mature. Cette sequence inclus le peptide G10 (Cys474-Pro488) decrit par Mori et al. [J. Biol. Chem. 
263 (1988) 17901-17904] et capable d'antagoniser I'interaction du vWF humain a la GP1b des plaquettes humaines, 
Lasequence correspondant au peptide G10 est d'abord incluse dans un fragment de restriction Mstll-Hindlll (Figure 

20 A, panneau B), par exemple par amplification PCR du plasmide pET-8c52K avec les oligodeoxynucleotides Sq1969 
et 5-CCCGGGATCC AAGCTTA GTCCTCCACATACAG-3' (Sq1970, le site Hindlll est souligne), ce qui genere un frag- 
ment de restriction Mstll-Hindlll incluant le peptide G10, et dont la sequence est: 5 -CCTTAGGC TTAACCTGTGAA- 
GCCTGCCAGGAGCCGGGAGGCCTGGTGGTGCCTCCCACAGATGCCCCGGTGAGCCCCAC- 
CACTCTGTATGTGGAGGAC TAAGCTT- 3' (la sequence codant pour le peptide G10 est en caracteres gras). La liga- 

25 ture de ce fragment avec le fragment de restriction Hind lll-Mstll correspondant a la totalite du gene codant pour la 
...SAH a. I'exception des trois.acides amines les plus C-terminaux (cf. SEQ ID n° 1) gen6re un fragment de restriction 
Hind lll comportant un gene hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1, panneau A), 
imm6diatement precedee de la region d'exportation "prepro" de la SAH. Ce fragment de restriction est clone dans 
I'orientation productive dans le site Hindlll du plasmide pYG105, ce qui genere le plasmide d'expression pYG1214. 

30 [0050] Dans un autre mode de realisation, le site de liaison du vWF a la GP1b est directement congu a I'aide d'oli- 
godeoxynucleotides synthetiques, et par exemple les oligodeoxynucleotides 5-TTAGGCCTCTGTG ACCTTG CCCC- 
TGMGCCCCTCCTCCTACTCTGCCCCCCTAAGCTTA-3' et 5'-G ATCTAAGCTTAGGGGGGCAG AGTAG G AG- 
GAGGGGCTTCAGGGGCAAGGTCACAGAGGCC-3\ Ces oligodeoxynucleotides ferment en s'appariant un fragment 
de restriction M^II~BgM incluant le fragment Mstll-Hindlll (Figure 4, panneau C) correspondant au peptide D5 defini 

35 par les residus Leu694 a Pro708 du vWF. La ligature du fragment Mstll- Hind lll avec le fragment de restriction Hind lll- 
Mst ll correspondant a la totalite du gene codant pour la SAH a I'exception des trois acides amines les plus C-terminaux 
(cf. SEQ ID n° 1) genere un fragment de restriction Hind lll comportant un gene hybride codant pour une proteine 
chimere du type SAH-PEPTIDE (Figure 1 , panneau A), immediatement precedee de la region d'exportation "pr6pro" 
de la SAH. Ce fragment de restriction est clone dans I'orientation productive dans le site Hind lll du plasmide pYG105, 

40 ce qui genere le plasmide d'expression pYG1206. 

[0051] Des variants utiles du plasmide pET-8c52K sont deletes par mutagenese dirigee entre les peptides G10 et 
D5, par exemple des sites de fixation au collagene, et/ou a I'heparine, et/ou a la botrocetine, et/ou aux sulfatides et/ 
ou a la ristocetine. Un exemple est le plasmide pMMB9 delete par mutagenese dirigee entre les residus Cys509 et 
Ile662. ^amplification PCR de ce plasmide avec les oligodeoxynucleotides Sq1969 et Sq2029 genere un fragment de 

45 restriction Mstll-Hindlll (Figure 4, panneau D) incluant les residus Thr470 a Tyr508 et Arg663 a Val713 et en particulier 
les peptides G10 et D5 du vWF et delete en particulier de son site de fixation au collagene localise entre les residus 
Glu542 et Met622 [Roth G J. et al. Biochemistry 25 (1 986) 8357-836 1]. La ligature de ce fragment avec le fragment de 
restriction Hindlll-Mstll correspondant a la totalite du gene codant pour la SAH a I'exception des trois acides amines 
les plus C-terminaux (cf. SEQ ID n° 1) genere un fragment de restriction Hind lll comportant un gene hybride codant 

50 pour une proteine chimere du type SAH-PEPTIDE (Figure 1 , panneau A), immediatement precedee de la region d'ex- 
portation "prepro" de la SAH. Ce fragment de restriction est clone dans I'orientation productive dans le site Hindlll du 
plasmide pYG105, ce qui genere le plasmide d'expression pYG1223. 

[0052] Dans d'autres modes de realisation, ('utilisation des techniques combinees de mutagenese dirigee et d'am- 
plification PCR permet de gen6rer a volonte des variants du fragment de restriction Mstll -Hind lll du panneau A de la 
55 Figure 4 mais deletes d'un ou plusieurs sites de fixation aux sulfatides et/ou a la botrocetine et/ou a I'heparine et/ou 
au collagene, et/ou substitue par tout r6sidu implique dans Emergence de pathologies de type IIB associee au vWF. 
[0053] Dans d'autres variants utiles du plasmide pET-8c52K des mutations sbnt introduites, par exemple par muta- 
genese dirigee, pour remplacer ou supprimer tout ou partie de I'ensemble des cysteines presentes aux positions 471 , 
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474, 509 et 695 du vWF humain. Des exemples partlculiers sont ies plasmides p5E et p7E dans lesquels les cysteines 
presentes aux positions 471 et 474 d'une part et aux positions 471 , 474, 509 et 695 d'autre part ont ete respectivement 
remplaces par des residus glycine. L'amplification PCR de ces plasmides avec les oligodeoxynucleotides Sq2149 
(5 -CCCGGGATCCCTTAGGCTTAACCGGTGAAGCCGGC-3', le site Mstll est souligne) et Sq2029 permet de generer 

5 des fragments de restriction Mstll-Hindlll incluant les residus Thr470 a Val713 du vWF naturel a ['exception qu'au 
moins les residus cysteine aux positions 471 et 474 ont ete mutes en des residus glycine. La ligature de ces fragments 
avec le fragment de restriction Hind lll-Mstll correspondant a la totalite du gene codant pour la SAH a I'exception des 
trois acides amines les plus C-terminaux (cf. SEQ ID n° 1) genere un fragment de restriction Hind lll comportant un 
gene hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1, panneau A), immediatement pre- 

10 cedee de la region d'exportation "prepro" de la SAH. Ces fragments de restriction sont clones dans I'orientation pro- 
ductive dans le site Hind lll du plasmide pYG105, ce qui genere les plasmides d'expression pYG1283 (chimere SAH- 
vWF470-713, C471G, C474G) et pYG1279 (chimere SAH-vWF470-713, C471G, C474G, C509G, C695G). 
[0054] D'autres mutations particulierement utiles concernent au moins un residu implique dans des pathologies de 
type IIB associees au vWF (augmentation de I'affinite intrinseque du vWF pour la GP1b), comme les residus Arg543, 

15 Arg545, Trp550, Val551 , Val553, Pro574 ou Arg578 par exemple. Les techniques de recombinaison genetique in vitro 
permettent egalement d'introduire a volonte un ou des residus supplementaires dans la sequence du vWF et par 
exemple une methionine sumumeraire entre les positions Asp539 et Glu542. 

E.7.2. Fragments antagonistes de la fixation du vWF au sous endothelium. 

20 

[0055] Dans un mode de realisation particulier, les sites de liaison du vWF aux composantsdu tissu sous-endothelial, 
et par exemple du collagene, sont generes par amplication PCR du plasmide pET-8c52K, par exemple avec les oli- 
godeoxynucleotides Sq2258 (5'-GGATCCTTAGGGCTG-TGCAGCAGGCTACTG GACCTGGTC-3' , le site Mstll est 
souligne) et Sq2259 (5 , -GAATTCAAGCTTAACAGAGGTAGCTAACGATCTCGTCCC-3' l le site Hindlll est souligne), 

25 ce qui genere un fragment de restriction Mstll -Hind lll codant pour les residus Cys509 a Cys695 du vWF naturel. Des 

variants moleculaires de deletion ou modifies sont egalement generes qui comportent toute combinaison souhaitable 

entre les sites de fixation du vWF aux sulfatides et/ou a la botrocetine et/ou a I'heparine et/ou au collagene et/ou tout 
residu responsable d'une modification de I'affinite du vWF pour la GP1b (pathologies de type II associee au vWF). 
Dans un autre mode de realisation, le domaine capable de se fixer au collagene peut egalement provenir du fragment 

30 du vWF compris entre les residus 911 et 1114 etdecrit par Pareti etal. [J. Bid. Chem. (1987) 262: 13835-13841]. La 
ligature de ces fragments avec le fragment de restriction Hind lll-Mstll correspondant a la totalite du gene codant pour 
la SAH a I'exception des trois acides amines les plus C-terminaux (cf. SEQ ID n° 1) genere des fragments de restriction 
Hind lll comportant un gene hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1, panneau A), 
immediatement precedee de la region d'exportation "prepro" de la SAH. Ces fragments de restriction sont clones dans 

35 I'orientation productive dans le site Hind lll du plasmide pYG1 05, ce qui genere les plasmides d'expression correspon- 
dants, et par exemple le plasmide pYG1277 (SAH-vWF509-695). 

E.7.3. Purification et caracterisation moleculaire des chimeres entre SAH et vWF. 

40 [0056] Les chimeres presentes dans les sumageants de culture correspondant a la souche CBS 293.9 1 transformee, 
par exemple par les plasmides d'expression selon les exemples E.7.1. et E.7.2., sont caracterisees dans un premier 
temps a I'aide d'anticorps specifiques de la partie SAH et de la partie vWF. Les resultats des Figures 5 a 7 demontrent 
que la levure K lactis est capable de secreter des proteines chimeres entre la SAH et un fragment du vWF, et que ces 
chimeres sont immunologiquement reactives. II peut etre egalement souhaitable de purifier certaines de ces chimdres. 

45 La culture est alors centrifugee (1 0000 g, 30 min), le surnageant est passe a travers un filtre de 0,22 mm (Millipore), 
puis concentre par ultrafiltration (Arnicon) en utilisant une membrane dont le seuil de discrimination se situe a 30 kDa. 
Le concentrat obtenu est alors dialyse contre une solution de Tris HCI (50 mM pH 8) puis purifie sur colonne. Par 
exemple, le concentrat correspondant au surnageant de culture de la souche CBS 293.91 transformee par le plasmide 
pYG1206 est purifiee par chromatographie d'affinite sur Bleu-Trisacryl (IBF). Une purification par chromatographie 

so d'echange d'ions peut egalement etre utilisee. Par exemple dans le cas de la chimere SAH-vWF470-71 3, le concentrat 
obtenu apres ultrafiltration est dialyse contre une solution de Tris HCI (50 mM pH 8), puis depose par fractions de 20 
ml sur une colonne (5 ml) echangeuse de cations (S Fast Flow, Pharmacia) equilibree dans le meme tampon. La 
colonne est alors lavee plusieurs fois par la solution de Tris HCI (50 mM pH 8) et la proteine chimere est alors eluee 
de la colonne par un gradient (0 a 1 M) de NaCI. Les fractions contenant la proteine chimere sont alors reunies et 

55 dialysees contre une solution de Tris HCI 50 mM (pH 8) puis redeposees sur colonne S Fast Flow. Apres elution de la 
colonne, les fractions contenant la proteine sont reunies, dialysees contre de I'eau et lyophilisees avant caracterisation: 
par exemple, le sequencage (Applied Biosystem) de la proteine [SAH-vWF470-704 C471G, C474G] secretee par la 
levure CBS 293.91 donne la sequence N-terminale attendue de la SAH (Asp-Ala-His...), demontrant une maturation 
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correcte de la chimere immediatement en C-terminal du doublet de residus Arg-Arg de la region "pro" de la SAH (SEQ 
I D n° 1 ) . Le caractere essentiellement monomerique des proteines chimeres entre SAH et vWF est egalement confirme 
par leur profil dilution sur colonne TSK 3000 [Toyo Soda Company, equilibree par une solution de cacodyiate (pH 7) 
contenant 0,2 M de Na^OJ : par exemple la chimere [SAH-vWF 470-704 C471G, C474G] se comporte dans ces 
5 conditions comme une proteine de poids moleculaire apparent de 95 kDa demontrant son caractere monomerique. 

EXEMPLE 8 : CHIMERES DERIVEES DE L'UROKINASE 

E.8.1. Constructions. 

10 

[0057] Un fragment correspondant au fragment amino-terminal de I'urokinase (ATF: domaine EGF-like + domaine 
kringle) peut etre obtenu a partir de TARN messager correspondant des cellules de certains carcinome humain, par 
exemple en utilisant le kit RT-PCR distribue par Pharmacia. Un fragment de restriction Mstll -Hind lll incluant I'ATF de 
I'urokinase humaine est donne SEQ ID n° 3. La ligature du fragment Hind i H-Mstl I du plasm idepYG404 avec ce fragment 

15 Mstll -Hind lll permet de generer le fragment Hindlll du plasmide pYG1341 qui code pour une proteine chimere dans 
laquelle la molecule de SAH est genetiquement couplee a I'ATF (SAH-UK1->135). De fagon similaire, le plasmide 
pYG1340 contient un fragment Hindlll codant pour une chimere composee de la SAH immediatement suivi par les 46 
premiers residus de I'urokinase humaine (SAH-UK1->46, cf. SEQ ID n° 3). Le clonage dans I'orientation productive 
du fragment de restriction Hind lH du plasmide pYG1340 (SAH-UK1->46) dans le site Hind lH des plasmides pYG105 

20 (LAC4 ) et pYG106 (PGK) genere les plasmides d'expression pYG1343 et pYG1342, respectivement. De facon simi- 
laire, le clonage dans I'orientation productive du fragment de restriction Hind lH du plasmide pYG1341 (SAH-UK1->135) 
dans le site Hind lH des plasmides pYG1 05 (LAC4 ) et pYG1 06 (PGK) genere les plasmides d'expression pYG1345 et 
pYG1344, respectivement. 

25 E-8.2. Secretion des hybrides. 



[0058] Apres selection sur milieu riche supplements en G4 1 8 les clones recombinants sont testes pour leur capacite 
a secreter la forme mature des proteines chimeres SAH-UK. Quelques clones correspondant a la souche K. lactis CBS 
293.91 transformee par les plasmides d'expression selon I'exemple E.9.1 sont mis a incuber en milieu liquide complet 
30 selectif a 28°C. Les sumageants cellulaires sont alors testes apres electrophorese en gel d'acryiamide a 8.5 %, soit 
directement par coloration du gel au bleu de coomassie, soit apres immunoblot en utilisant comme anticorps primaires 
un serum polyclonal de lapin dirige contre I'albumine humaine ou contre rurokinase humaine. Les resultats de la Figure 
9 demontrent que les proteines hybrides SAH-UK1->46 et SAH-UK1->135 sont particulierement bien secr6tees par la 
levure KJuyveromyces. 

35 

E.8.3. Purification des chimeres entre SAH et urokinase. 

[0059] Apres centrifugation d'une culture de la souche CBS 293 .9 1 transformee par les plasmides d'expression selon 
I'exemple E.8.1. , le sumageant de culture est passe a travers un filtre de 0,22 mm (Millipore), puis concentre par 

40 ultrafiltration (Amicon) en utilisant une membrane dont le seuil de discrimination se situe a 30 kDa. Le concentrat 
obtenu est alors ajuste a 50 mM Tris HCI a partir d'une solution stock de Tris HC1 1 M (pH 7), puis depose par fractions 
de 20 ml sur une colonne (3 ml) echangeuse d'anions (D-Zephyr, Sepracor) equilibree dans le meme tampon. La 
proteine chimere (SAH-UK1->46 ou SAH-UK1->135) est alors eluee de la colonne par un gradient (0 a 1 M) de NaCI. 
Les fractions contenant la proteine chimere sont alors reunies et dialysees contre une solution de Tris HCI 50 mM (pH 

45 6) et redeposees sur colonne D-Zephyr equilibree dans le meme tampon. Apres elution de la colonne, les fractions 
contenant la proteine sont reunies, dialysees contre de I'eau et lyophilisees avant caracterisation de leur activite bio- 
logique et notamment vis a vis de leur aptitude a deplacer I'urokinase de son necepteur cellulaire. 

EXEMPLE 9 : CHIMERES DERIVEES DU G-CSF 

50 

E.9.1. Constructions. 

E.9.1. 1. Couplageen C-terminal de la SAH. 

55 [0060] Un fragment de restriction Mstll -Hind l II incluant la forme mature du G-CSF humain est genere, par exemple 
selon la strategie suivante : un fragment de restriction Kpnl -Hind lll est d'abord obtenu par la technique d'amplification 
enzymatique PCR en utilisant les oligodeoxynucleotides Sq2291 (5-CAAGGATC CAAGCTTC AGGGCTGCG- 
CAAGGTGGCGTAG-3', le site Hindll I est souligne) et Sq2292 (5-CGGGGTACCTTAGGCTTAACCCCCCTGGGCCC- 



12 



EP 0 624 195 B1 

TGCCAGC-3', le site Kpnl est souligne) comme amorce sur le plasmide BBG 1 3 servant comme matrice. Le plasmide 
BBG13 comporte le gene codant pour la forme B (174 acides amines) du G-CSF mature humain, obtenu aupres de 
British Bio-technology Limited, Oxford, England. Le produit d'amplification enzymatique d'environ 550 nucleotides est 
ensuite digere par les enzymes de restriction Kgnl et Hindi 1 1 et clone dans le vecteur pUC19 coupe par les m§mes 
5 enzymes, ce qui genere le plasmide recombinant pYG1255. Ce plasmide est la source d'un fragment de restriction 
Mstll-Hindlll permettant de fusionner le G-CSF immediatement en aval de la SAH (chimere SAH-G.CSF) et dont la 
sequence nucleotidique est donnee SEQ ID n° 4. 

[0061] II peut etre egalement souhaitable d'inserer un linker peptidique entre la partie SAH et G-CSF, par exempie 
pour permettre une meilleure presentation fonctionnelle de la partie transductrice. Un fragment de restriction Mst ll- 

10 Hind lll est par exempie gener6 par substitution du fragment Mstll-Apal du plasmide pYG1255 par les oligodeoxynu- 
cleotides Sq2742 (5 , -TTAGGCTT AGGTGGTGGCGGTA CCCCCCTGGGCC-3 , t les codons codant pour les residus gly- 
cine de ce linker particulier sont soulignes) et Sq2741 (5'-CAGGGGGGTACCGCCACCACCTAAGCC-3') qui forment 
en s'appariant un fragment Mstll-Apal. Le plasmide ainsi gener<§ comporte done un fragment de restriction Mstll- Hind lll, 
dont la sequence est identique a celle de la SEQ ID n° 4 a I'exception du fragment Mstll-Apal. 

15 [0062] La ligature du fragment Hind lll-Mstll du plasmide pYG404 avec le fragment Mstll -Hind lll du plasmide 
pYG1255 permet de generer le fragment Hind lll du plasmide pYG1259 qui code pour une proteine chimere dans 
laquelle la forme B du G-CSF mature est positionnee par couplage genetique en phase traductionnelle en C-terminal 
de la molecule de SAH (SAH-G.CSF). 

[0063] Un fragment de restriction Hind lll identique a I'exception du fragment Mstll-Apal peut egalement §tre facile- 
20 ment gener6 et qui code pour une proteine chimere dans laquelle la forme B du G-CSF mature est positionnee par 
couplage g6netique en phase traductionnelle en C-terminal de la molecule de SAH et d'un linker peptidique particulier. 
Par exempie ce linker est constitue de 4 residus glycine dans le fragment Hind lll du plasmide pYG1336 (chimere 
SAH-Gly 4 -G.CSF). 

[0064] Le fragment de restriction Hind lll du plasmide pYG1259 est clone dans I'orientation productive et dans le site 
25 de restriction Hind lll du plasmide d'expression pYG105, ce qui genere le plasmide depression pYG1266 (SAH-G. 
CSF). Dans une autre exemplification, le clonage du fragment de restriction Hindl ll du plasmide pYG1259 dans I'orien- 
tation productive et dans le site Hind lll du plasmide pYG106 genere le plasmide pYG1267. Les plasmides pYG1266 
et pYG1 267 sont isogeniques entre eux a I'exception du fragment de restriction Sall-Hindll I codant pour le promoteur 
LAC 4 de K. lactis (plasmide pYG1266) ou le promoteur PGK de S. cerevisiae (plasmide pYG1267). 
30 [0065] Dans une autre exemplification, le clonage dans I'orientation productive du fragment de restriction Hind lll du 
plasmide pYG1336 (chimere SAH-Gly 4 -G.CSF) dans le site Hindlll des plasmides pYG105 (LAC4) et pYG106 (PGK) 
genere les plasmides d'expression pYG1351 et pYG1352, respectivement. 

E.9.1.2. Couplage en N-terminal de la SAH. 

35 

[0066] Dans un mode realisation particulier, les techniques com binees de mutag6nese dirigee et d'amplification PCR 
permettent de construire des genes hybrides codant pour une proteine chimere resultant du couplage traductionnel 
entre un peptide signal (et par exempie la region prepro de la SAH), une sequence incluant un gene ayant une activity 
G-CSF, et la forme mature de la SAH ou un de ses variants moleculaires (cf. chimere du panneau B, Figure 1). Ces 
40 g&nes hybrides sont preferentiellement bordes en 5' de I'ATG initiateur de traduction et en 3' du codon de fin de tra- 
duction par des sites de restriction Hindi 1 1 . Par exem pie I'oligc^ 

CAGCC CGGTGGAGGCGGT GATGCACACAAGAGTGAGGTTGCTCATCGG-3', les residus soulignes (optionnels) 
correspondent dans cette chimere particuliere a un linker peptidique compose de 4 residus glycine) permet par muta- 
genese dirigee de mettre en phase traductionelle la forme mature du G-CSF humain du plasmide BBG 13 immediate- 

45 ment en amont de la forme mature de fa SAH, ce qui genere le plasmide intermediaire A. De facon similaire, ('utilisation 
de roligodeoxynucleotide Sq2338 [5' -CAGGGAGCTGGCAGGGCCCAGGGGGGTT CGACGAAACACACCCCTG- 
G AATAAGCCGAGCT-3' (brin non codant), les nucleotides complementaires aux nucleotides codant pour les premiers 
residus N-terminaux de la forme mature du G-CSF humain sont soulignes] permet par mutagenese dirigee de coupler 
en phase traductionnelle de lecture la region prepro de la SAH immediatement en amont de la forme mature du G-CSF 

50 humain, ce qui genere le plasmide intermediaire B. On genere ensuite un fragment Hind lll codant pour une proteine 
chimere du type PEPTIDE-SAH (cf. Figure 1 , panneau B) en associant le fragment Hindlll-Sstl du plasmide B (jonction 
region prepro de la SAH + fragment N-terminal du G-CSF mature) avec le fragment Sstl-Hindl 1 1 du plasmide A [jonction 
G-CSF mature-(glycine) x4 -SAH mature]. Le plasmide pYG1 301 contient ce fragment de restriction Hindlll particulier 
codant pour la chimere G.CSF-Gly 4 -SAH fusionnee immediatement en aval de la region prepro de la SAH (SEQ ID 

55 n ° 5). Le clonage de ce fragment de restriction Hind lll dans I'orientation productive et dans le site Hind lll des plasmides 
pYG 1 05 (LAC4) et pYG 1 06 (PGK) genere les plasmides d'expression pYG 1 302 et pYG 1 303, respectivement. 
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E.9.2. Secretion des hybrides. 

[0067] Apres selection sur milieu riche supplements en G41 8 les clones recombinants sont testes pour leur capacite 
a secreter la forme mature des proteines chimeres entre SAH et G-CSF. Quelques clones correspondant a la souche 

5 K. lactis CBS 293.91 transformee par les plasmides pYG1266 ou pYG1267 (SAH-G.CSF), pYG1302 ou pYG1303 (G. 
CSF-Gly 4 -SAH) ou encore pYG1351 ou pYG1352 (SAH-Gly 4 -G.CSF) sont mis a incuber en milieu liquide complet 
selectif a 28°C. Les sumageants cellulaires sont alors testes apres electrophorese en gel d'acrylamide a 8.5 %, soit 
directement par coloration du gel au bleu de coomassie, soit apres immunoblot en utilisant comme anticorps primaires 
des anticorps polyclonaux de lapin diriges contre le G-CSF humain ou un serum polyclonal de lapin dirige contre 

10 I'albumine humaine. Les resultats de la Figure 12 demontrent que la proteine hybride SAH-G.CSF est reconnue a la 
fois par des anticorps diriges contre I'albumine humaine (panneau C) et le G-CSF humain (panneau B). Les resultats 
de la Figure 13 indiquent que la chimere SAH-Gly 4 -G.CSF (piste 3) est particulierement bien secretee par la levure 
Kluyveromyces , possiblement du fait que la presence du linker peptidique entre partie SAH et partie G-CSF est plus 
favorable a un repliement independant de ces 2 parties lors du transit de la chimere dans la voie secretaire. De plus 

15 la fusion N-terminale (G.CSF-Gly 4 -SAH) est egalement secretee par la levure Kluyveromyces (Figure 1 3, piste 1 ). 

E.9.3. Purification et caracterisation moleculaire des chimeres entre SAH et G-CSF. 

[0068] Apres centrifugation d'une culture de la souche CBS 293.91 transformee par les plasmides d'expression selon 
20 Texemple E.9.1., le sumageant de culture est passe a travers un filtre de 0,22 mm (Millipore), puis concentre par 
ultrafiltration (Amicon) en utilisant une membrane dont le seuil de discrimination se situe a 30 kDa. Le concentrat 
obtenu est alors ajuste a 50 mM Tris HCI a partir d'une solution stock de Tris HC1 1 M (pH 6), puis depose par fractions 
de 20 ml sur une colonne (5 ml) echangeuse d'ions (Q Fast Flow, Pharmacia) equilibree dans le meme tampon. La 
proteine chimere est alore eluee de la colonne par un gradient (0 a 1 M) de NaCI. Les fractions contenant la proteine 
25 chimere sont alors reunies et dialysees contre une solution de Tris HCI-50 mM (pH 6) et redeposees sur colonne Q 
Fast Flow (1 ml) equilibree dans le meme tampon. Apres elution-de la colonne, les fractions contenant la proteine sont 
reunies, dialysees contre de I'eau et lyophilisees avant caracterisation: par exemple, le sequencage (Applied Biosys- 
tem) de la proteine SAH-G.CSF secretee par la levure CBS 293.91 donne la sequence N-terminale attendue de la 
SAH (Asp-Ala-His...), demontrant une maturation correcte de la chimere immediatement en C-terminal du doublet de 
30 residus Arg-Arg de la region "pro" de la SAH (SEQ ID n° 1). 

EXEMPLE 10 : CHIMERES DERIVEES D'UNE IMMUNOGLOBULINE 

E.10.1. Constructions. 

35 

[0069] Un fragment Fv' peut etre construit par les techniques du genie genetique, et qui code pour les fragments 
variables des chaines lourdes et legeres d'une immunoglobuline (Ig), relies entre eux par un peptide linker [Bird et al., 
Science (1988) 242: 423 ; Huston etal., (1988) Proc. Natl. Acad. Sci. 85: 5879]. Schematiquement, les regions variables 
(environ 120 residus) des chaines lourdes et legeres d'une Ig donnee sont donees a partir de TARN messager de 

40 I'hybridome correspondant, par exemple en utilisant le kit RT-PCR distribue, par Pharmacia (Mouse ScFv Module). 
Dans une seconde etape les regions variables sont genetiquement couplees par genie genetique par I'intermediaire 
d'un peptide de liaison synthetique et par exem pie le linker (GGGGS^. Un fragment de restriction Mstll- Hind lll incluant 
le fragment Fv* d'une immunoglobuline secretee par un hybridome murin est donne SEQ I D n° 6. La ligature du fragment 
Hindlll-MstH du plasmide pYG404 avec ce fragment Mstll-Hindlll permet de generer le fragment Hindi 1 1 du plasmide 

45 pYG1382 qui code pour une proteine chimere dans laquelle la molecule de SAH est genetiquement couplee au frag- 
ment FV de la SEQ ID n° 6 (chimere SAH-Fv'). Le cionage dans I'orientation productive du fragment de restriction 
Hind lll du plasmide pYG1382 dans le site Hind II I des plasmides pYG105 (LAC4) et pYG106 (PGK) genere les plas- 
mides d'expression pYG1383 et pYG1384, respectivement. 

50 E.10.2. Secretion des hybrides. 

[0070] Apres selection sur milieu riche supplements en G418 les clones recombinants sont testes pour leur capacite 
a secreter la forme mature de la proteine chimere SAH-Fv*. Quelques clones correspondant a la souche K. lactis CBS 
293.91 transformee par les plasmides pYG1383 ou pYG1384 (SAH-Fv*) sont mis a incuber en milieu liquide complet 
55 selectif a 28°C. Les sumageants cellulaires sont alors testes apres electrophorese en gel d'acrylamide a 8.5 %, soit 
directement par coloration du gel au bleu de coomassie, soit apres immunoblot en utilisant comme anticorps primaires 
un serum polyclonal de lapin dirige contre I'albumine humaine, ou directement incubee avec des anticorps biotinyles 
et diriges contre les immunoglobulins d'origine murine. Les resultats de la Figure 15 demontrent que la proteine 
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hybride SAH-Fv' est reconnue a la fois par des anticorps diriges contre I'albumine humaine (panneau C) et reagit avec 
des anticorps de chevre biotinyles im munologiquement reactifs a I'encontre dlmmunoglobulines de souris (panneau B). 

EXEMPLE 11 : ACTIVITE BIOLOGIQUE DES CHIMERES 

5 

E.11.1. Activite biologique in vitro. 
E.11.1.1. Chimeres entre SAHetvWF. 

10 [0071] L'activite antagoniste des produits est determinee par mesure de Inhibition dose-dependante de I'agglutina- 
tion des plaquettes humaines fixees au paraform aldehyde ; selon la methode decrite par Prior et al. [Bio/Technology 
(1992) 10: 66]. Les mesures se font dans un agregametre (PAP-4, Bio Data, Horsham, PA, USA) qui enregistre les 
variations au cours du temps de la transmission optique sous agitation a 37°C en presence de vWF, de botrocetine 
(8,2 mg/ml) etdu produit a tester a differentes dilutions (concentrations). Pourchaque mesure, 400 ml (8x1 0 7 plaquet- 

15 tes) d'une suspension de plaquettes humaines stabilisees au paraformaldehyde (0,5 %, puis resuspendues en [NaCI 
(137 mM) ; MgCI 2 (1 mM) ; NaH 2 P0 4 (0,36 mM) ; NaHC0 3 (10 mM) ; KCI (2,7 mM) ; glucose (5,6 mM) ; SAH (3,5 mg/ 
ml) ; tampon HEPES (10 mM, pH 7,35)] sont preincubes a,37°C dans la cuve cylindrique (8,75 x 50 mm, Wellcome 
Distriwell, 159 rue Nationale, Paris) de I'agregametre pendant 4 min puis sont additionnes de 30 ml de la solution du 
produit a tester a differentes dilutions dans du vehicule de formulation apyrogene [mannitol (50 g/l) ; acide citrique (192 

20 mg/l) ; L-lysine monochlorhydratee (182,6 mg/l) ; NaCI (88 mg/l) ; pH ajuste a 3,5 par addition de NaOH (1 M)], ou de 
vehicule de formulation uniquement (essai controle). La suspension resultante est alors incubee pendant 1 min a 37°C 
et on ajoute 12,5 ml de vWF humain [American Byproducts, Parsippany, NJ, USA; 11 % d'activite von Willebrand 
mesuree selon les recommandations d'utilisation du PAP^ (Platelet Aggregation Profiler*) a I'aide de plaquettes fixees 
au formaldehyde (2x1 0 5 plaquettes/ml), de plasma humain contenant de 0 a 1 00 % de vWF et de ristocetine (1 0 mg/ 

25 ml, cf. p. 36-45 : vW Program™] que Ton incube a 37°C pendant 1 min avant d'ajouter 12,5 ml de la solution de 

botrocetine [purifiee a partir de venin lyophilise de Bothrops jararaca (Sigma), selon le protocole decrit par Sugimoto 

et al., Biochemistry (1991) 266: 18172]. L'enregistrement de la lecture de la transmission en fonction du temps est 
alors realisee pendant 2 min sous agitation a I'aide d'un barreau aimante (Wellcome Distriwell) place dans la cuve et 
sous une agitation magnetique de 1100 tr/min assuree par I'agregametre. La variation moyenne de la transmission 

30 optique (n 3 5 pour chaque dilution) au cours du temps est done une mesure de I'agglutination plaquettaire due a la 
presence de vWF et de botrocetine, en I'absence ou en presence de concentrations variables du produit a tester. A 
partir de tels enregistrements, on determine alors le % d'inhibition de I'agglutination plaquettaire due a chaque con- 
centration de produit et on trace la droite donnant le % d'inhibition en fonction de Hnverse de la dilution de produit en 
echelle log-log. La CI50 (ou concentration de produit provoquant 50 % d'inhibition de I'agglutination) est alors deter- 

35 minee sur cette droite. Le Tableau de la Figure 1 6 compare les CI50 de quelques unes des chimeres SAH-vWF de la 
presente invention et demontre que certaines d'entre elles sont de meilleurs antagonistes de I'agglutination plaquettaire 
que le produit RG 12986 decrit par Prior et al. [Biotechnology (1992) 10: 66] et inclus dans les essais a titre de valeur 
etalon. Des tests identiques de inhibition de I'agglutination de plaquettes humaines en presence de vWF de plasma 
de pore (Sigma) permet en plus de demontrerque certains des hybrides de la presente invention, et notamment certains 

40 variants de type IIB, sont de tres bons antagonistes de I'agglutination plaquettaire en Tabsence de co-facteurs de type 
botrocetine. L'antagonisme botrocetine-independant de ces chimeres particulidres peut egalement etre demontre selon 
le protocole initialement decrit par Ware et al. [Proc. Natl. Acad. Sci. (1991) 88: 2946] par deplacement de I'anticorps 
monoclonal 12 5i-LJ-IB1 (10 mg/ml), un inhibiteur competitif de la fixation du vWF sur la GPIb plaquettaire [Handa M. 
et al., (1986) J. Biol. Chem. 261: 12579] apres 30 min d'incubation a 22°C en presence de plaquettes fraiches (10^ 

45 plaquettes/ml). 

E.11.1.2. Chimdres entre SAH et G-CSF. 

[0072] Les chimeres purifiees sont testees pour leur capacite a permettre la proliferation in vitro de la lignee murine 
50 IL3-dependante NFS60, par mesure de rincorporation de thymidine tritiee essentiellement selon le protocole decrit 
par Tsuchiya et al. (Proc. Natl. Acad. Sci. (1986) 83 7633]. Pour chaque chimere, les mesures sont realisees entre 3 
et 6 fois dans un test trois points (trois dilutions du produit) dans une zoneou la relation entre quantite de produit actif 
et incorporation de thymidine marquee (Ametsham) est lineaire. Dans chaque plaque de microtitration, Tactivite d'un 
produit reference constitue de G-CSF humain recombinant exprime dans des cellules mammiferes est egalement 
55 systematiquementincorpore. Lesresultatsdela Figure 1 7 demontrent que la chimere SAH-G.CSF (pYG1 266) secretee 
par la levure Kluyveromyces et purifiee selon I'exemple E.9.3. est capable in vitro de transduire un signal de proliferation 
cellulaire pour la lignee NFS60. Dans ce cas particulier, I'activite specifique (cpm/molarit6) de la chimere est environ 
7 fois plus faible que celle du G-CSF reference (non couple). 
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E.11.2. Activity biologique inviyo. 

[0073] L'activite de stimulation des chimeres SAH/G-CSF surla qranulopoiese in vivo est testee apres injection sous- 
cutanee chez le rat (Sprague-Dawley/CD, 250-300 g, 8-9 semaines) et comparee a celle du G-CSF reference expnme 
a partirde cellules de mammifere. Chaque produit, teste a raison de 7 animaux, est injecte par voie sous-cutanee en 
region dorso-scapulaire a raison de 100 ml pendant 7 jours consecutifs (J1-J7). 500 ml de sang sont receuillis aux 
jours J-6, J2 (avant la &™ injection), J5 (avant la 5*>™ injection) et J8, et une numeration sanguine est effectuee. 
Dans ce test, l'activite specifique (unites de neutropoiese/mole injectee) de la chimere SAH-G.CSF (pYG1266) est 
identique a celle du G-CSF reference (Figure 18). Puisque cette chimere particuliere possede in vitro une activite 
specifique 7 fois plus faible que celle du G-CSF reference (Figure 1 J), il est done demontre que le couplage genetique 
du G-CSF sur la SAH en modifie favorablement les proprietes pharmacocinetiques. 

LISTE DE SEQUENCES 

[0074] 

(2) INFORMATION POUR LA SEQ ID NO: 1 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1859 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc - 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 26..1855 

(D) AUTRES RENSEIGNEMENTS: /product= "Chimere de type SAH-Peptide w 
(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: miscjeature 

(B) EMPLACEMENT: 1842..1848 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Mst II" 
(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 750 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 
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(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..746 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-vWF470" 
(2) INFORMATION POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 423 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(lil) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..419 

(D) AUTRES RENSEIGNEMENTS: 7product= "Fragment C-ter de la chimere SAH-UK1-135" 

(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 541 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..536 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-G.CSF" 
(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2455 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
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(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

t 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 26..2389 

(D) AUTRES RENSEIGNEMENTS: /product "Chimera G.CSF-Gly4-SAH en aval region prepro de SAH" 
(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc^recomb 

(B) EMPLACEMENT: 620..631 

(D) AUTRES RENSEIGNEMENTS: /standard_name= Tinker PolyGly" 
(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc feature 

(B) EMPLACEMENT: 106..111 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Apa I" 
(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 756 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..7S2 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-terde la chimere SAH-Fv'" 
(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc.recomb 

(B) EMPLACEMENT: 384. .428 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Linker synthetique" 
LISTE DE SEQUENCES 
[0075] 

(1) INFORMATION GENERALE: 
(i) DEPOSANT: 

(A) NOM: RHONE-POULENC RORER S.A. 
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(B) RUE: 20, avenue Raymond ARON . 

(C) VILLE: ANTONY 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92165 

5 i 

(ii) TITRE DE L' INVENTION: NOUVEAUX POLYPEPTIDES BIOLOGIQUEMENT ACTIFS, LEUR PREPARA- 
TION ET COMPOSITION PHARMACEUTIQUE LES CONTENANT 

(iii) NOMBRE DE SEQUENCES: 6 

10 

(iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Tape 

(B) ORDINATEUR: IBM PC compatible 

15 (C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1 .0, Version #1 .25 (OEB) 

i 

(2) INFORMATION POUR LA SEQ ID NO: 1 : 
20 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1859 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 
25 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 

30 

(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

35 (A) NOM/CLE: CDS 

(B) EMPLACEMENT: 26.. 1855 

(D) AUTRES RENSEIGNEMENTS: /product= "Chimere de type SAH-Peptide" 
(ix) CARACTERISTIQUE ADDITIONELLE: 

40 

(A) NOM/CLE: misc_feature 

(B) EMPLACEMENT: 1842..1848 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Mst II" 
45 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1 : 



AAGCTTTACA ACAAATATAA AAACA ATG AAG TGG GTA ACC TTT ATT TCC CTT 52 

Met Lys Trp Val Thr Phe He Ser Leu 
1 5 

50 . 



CTT TTT CTC TTT AGC TCG GCT TAT TCC AGG GGT GTG TTT CGT CGA GAT 100 
Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Gly Val Phe Arg Arg Asp 

55 10 15 20 25 
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GCA CAC AAG AGT GAG GTT GCT CAT CGG TTT AAA GAT TTG GGA GAA GAA 
Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Glu 
30 35 40 



148 



10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



AAT TTC AAA GCC TTG GTG TTG ATT GCC TTT GCT CAG TAT CTT CAG CAG 196 
Asn Phe Lys Ala Leu Val Leu lie Ala Phe Ala Gin Tyr Leu Gin Gin 
45 50 55 



TGT CCA TTT GAA. GAT CAT GTA AAA TTA GTG AAT GAA GTA ACT GAA TTT 244 
Cvs Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe 
y 60 65 70 



GCA AAA ACA TGT GTT GCT GAT GAG TCA GCT GAA AAT TGT GAC AAA TCA 292 
Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser 
75 80 65 



CTT CAT ACC CTT TTT GGA GAC AAA TTA TGC ACA GTT GCA ACT CTT CGT 340 
Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg 
90 95 100 105 

GAA ACC TAT GOT GAA ATG GCT GAC TGC TGT GCA AAA CAA GAA CCT GAG - 388 
Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gin Glu Pro Glu 
1 1 (5 115 120 



AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC CCA AAC CTC CCC 436 
Ara Asn Glu Cys Phe Leu Gin His Lys Asp Asp Asn Pro Asn Leu Pro 
125 130 135 



CGA TTG GTG AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT CAT GAC 484 
Ara Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp 
140 145 150 



AAT GAA GAG ACA TTT TTG AAA AAA TAC TTA TAT GAA ATT GCC AGA AGA 532 
Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu lie Ala Arg Arg 
155 160 165 



CAT CCT TAC TTT TAT GCC CCG GAA CTC CTT TTC TTT GCT AAA AGG TAT 580 
His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr 
170 175 180 185 



AAA GCT GCT TTT ACA GAA TGT TGC CAA GCT GCT GAT AAA GCT GCC TGC 628 
Lys Ala Ala Phe Thr Glu Cys Cys Gin Ala Ala Asp Lys Ala Ala Cys 
* 190 195 200 



CTG TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA GGG AAG GCT TCG TCT 676 
Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Ser 
205 210 215 
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GCC AAA CAG AGA CTC AAG TGT GCC AGT CTC CAA AAA TTT GGA GAA AGA 724 
Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly Glu Arg 
220 225 230 

5 i 



10 



15 



20 



GCT TTC AAA GCA TGG GCA GTA GCT CGC CTG AGC CAG AGA TTT CCC AAA 772 
Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gin Arg Phe Pro Lys 
235 240 245 



GOT GAG TTT GCA GAA GTT TCC AAG TTA GTG ACA GAT CTT ACC AAA GTC 820 
Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val 
250 255 260 265 



CAC ACG GAA TGC TGC CAT GGA GAT CTG CTT GAA TGT GCT GAT GAC AGG 868 
His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Arg 
270 275 280 



GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT TCG ATC TCC AGT 
25 Ala Asp Leu Ala Lys Tyr He Cys Glu Asn Gin Asp Ser He Ser Ser 
285 290 295 



916 



AAA CTG AAG GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC CAC TGC 
30 Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys 
300 305 310 



964 



ATT GCC GAA GTG GAA AAT GAT GAG ATG CCT GCT GAC TTG CCT TCA TTA 
35 He Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu 
315 320 325 



1012 



GCT GCT GAT TTT GTT GAA AGT AAG GAT GTT TGC AAA AAC TAT GCT GAG 1060 
Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu 
330 335 340 345 



GCA AAG GAT GTC TTC CTG GGC ATG TTT TTG TAT GAA TAT GCA AGA AGG 1 1 08 

Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg 
350 355 360 



CAT CCT GAT TAC TCT GTC GTA CTG CTG CTG AGA CTT GCC AAG ACA TAT 1156 
w His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr 
50 365 370 375 



GAA ACC ACT CTA GAG AAG TGC TGT GCC GCT GCA GAT CCT CAT GAA TGC 1204 
Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys 
55 380 385 390 
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10 



15 



20 



TAT GCC AAA GTG TTC GAT GAA TTT AAA CCT CTT GTG GAA GAG CCT CAG 1252 
Tvr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gin 
X 395 400 405 



AAT TTA ATC AAA CAA AAT TGT GAG CTT TTT GAG CAG CTT GGA GAG TAC 1300 
Asn Leu lie Lys Gin Asn Cys Glu Leu Phe Glu Gin Leu Gly Glu Tyr 
410 415 420 425 



AAA TTC CAG AAT GCG CTA TTA GTT CGT TAC ACC AAG AAA GTA CCC CAA 1 348 

Lys Phe Gin Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gin 
430 435 440 



GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC CTA GGA AAA GTG 1 396 
Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val 
445 450 455 

GGC AGC AAA TGT TGT AAA CAT CCT GAA GGA AAA AGA ATG CCC TGT GGA 1 444 

Glv Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala 

J tin ^ AG* 470 



460 " 465 470 

25 

GAA GAC TAT CTA TCC GTG GTC CTG AAC CAG TTA TGT GTG TTG CAT GAG 1492 

Glu Asp Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu His Glu 
475 480 485 

30 

AAA ACG CCA GTA AGT GAC AGA GTC ACC AAA TGC TGC ACA GAA TCC TTG 1540 
Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu 
490 495 500 505 



35 

GTG AAC AGG CGA CCA TGC TTT TCA GCT CTG GAA GTC GAT GAA ACA TAC 1 588 

Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr 
510 515 520 



40 



GTT CCC AAA GAG TTT AAT GCT GAA ACA TTC ACC TTC CAT GCA GAT ATA 1636 
Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp lie 
525 530 535 

45 

TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT GCA CTT 1684 
Cys Thr Leu Ser Glu Lys Glu Arg Gin lie Lys Lys Gin Thr Ala Leu 
540 545 550 



50 



GTT GAG CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA CTG AAA 
Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin Leu Lys 
555 560 565 



1732 



GCT GTT ATG GAT GAT TTC GCA GCT TTT GTA GAG AAG TGC TGC AAG GCT 1780 
Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala 
570 575 580 585 



22 



EP 0 624 195 B1 



GAC GAT AAG GAG ACC TGC TTT GCC GAG GAG GGT AAA AAA CTT GTT GCT 1828 
Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala 
590 595 600 



GCA AGT CAA GCT GCC TTA GGC TTA (NNN)p TAAGCTT 1859 

Ala Ser Gin Ala lia Leu Gly Leu PEPTIDE 
605 ~ 610 



(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 750 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iil) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: - - 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..746 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-terde la chimere SAH-vWF470" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 



CC TTA GGC TTA ACC TGT GAA GCC TGC CAG GAG CCG GGA GGC CTG GTG 47 
Leu Gly Leu Thr Cys Glu Ala Cys Gin Glu Pro Gly Gly Leu Val 
1 5 10 15 



GTG CCT CCC ACA GAT GCC CCG GTG AGC CCC ACC ACT CTG TAT GTG GAG 95 
Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu 
20 25 30 



GAC ATC TCG GAA CCG CCG TTG CAC GAT TTC TAC TGC AGC AGG CTA CTG 143 
Asp lie Ser Glu Pro Pro Leu His Asp Phe Tyr Cys Ser Arg Leu Leu 
35 40 45 

GAC CTG GTC TTC CTG CTG GAT GGC TCC TCC AGG CTG TCC GAG GCT GAG 191 
Asp Leu Val Phe Leu Leu Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu 
50 55 60 

TTT GAA GTG CTG AAG GCC TTT GTG GTG GAC ATG ATG GAG CGG CTG CGC 239 
Phe Glu Val Leu Lys Ala Phe Val Val Asp Met Met Glu Arg Leu Arg 
65 70 75 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



ATC TCC CAG AAG TGG GTC CGC GTG GCC GTG GTG GAG TAC CAC GAC GGC 287 
He Ser Gin Lys Trp Val Arg Val Ala Val Val Glu Tyr His Asp Gly 
80 65 90 95 



TCC CAC GCC TAC ATC GGG CTC AAG GAC CGG AAG CGA CCG TCA GAG CTG 335 
Ser His Ala Tyr He Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu 
100 105 >10 

CGG CGC ATT GCC AGC CAG GTG AAG TAT GCG GGC AGC CAG GTG GCC TCC 383 
Arg Arg He Ala Ser Gin Val Lys Tyr Ala Gly Ser Gin Val Ala Ser 
115 120 125 



ACC AGC GAG GTC TTG AAA TAC ACA CTG TTC CAA ATC TTC AGC AAG ATC ~ 431 
Thr Ser Glu Val Leu Lys Tyr Thr Leu Phe Gin He Phe Ser Lys He 
130 135 140 



GAC CGC CCT GAA GCC TCC CGC ATC GCC CTG CTC CTG ATG GCC AGC CAG 479 
Aso Aro Pro Glu Ala Ser Arg He Ala Leu Leu Leu Met Ala Ser Gin 
145 150 155 



GAG CCC CAA CGG ATG TCC CGG AAC TTT GTC CGC TAC GTC CAG GGC CTG 527 
Glu Pro Gin Arg Met Ser Arg Asn Phe Val Arg Tyr Val Gin Gly Leu 
160 165 170 175 



AAG AAG AAG AAG GTC ATT GTG ATC CCG GTG GGC ATT GGG CCC CAT GCC 575 
Lys Lys Lys Lys Val He Val He Pro Val Gly He Gly Pro His Ala 
180 185 190 



AAC CTC AAG CAG ATC CGC CTC ATC GAG AAG CAG GCC CCT GAG AAC AAG 623 
Asn Leu Lys Gin He Arg Leu He Glu Lys Gin Ala Pro Glu Asn Lys 
195 200 205 



GCC TTC GTG CTG AGC AGT GTG GAT GAG CTG GAG CAG CAA AGG GAC GAG 671 
Ala Phe Val Leu Ser Ser val Asp Glu Leu Glu Gin Gin Arg Asp Glu 
210 215 220 



ATC GTT AGC TAC CTC TGT GAC CTT GCC CCT GAA GCC CCT CCT CCT ACT 71 9 

He Val Ser Tyr Leu Cys Asp Leu Ala Pro Glu Ala Pro Pro Pro Thr 
225 230 235 



CTG CCC CCC GAC ATG GCA CAA GTC TAAGCTT 750 
Leu Pro Pro Asp Met Ala Gin Val 
240 245 

(2) INFORMATION POUR LA SEQ ID NO: 3: 

(I) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 423 paires de bases , 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc ' 

(iii) HYPOTHETIQUE: OUI 
(ill) ANTI-SENS: OUI 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..419 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-UK1-135" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

CC TTA GGC TTA AGC AAT GAA CTT CAT CAA GTT CCA TCG AAC TGT GAC 47 
Leu Gly Leu Ser Asn Glu Leu His Gin Val Pro Sex Asn Cys Asp 
5 10 15 



1 



TGT CTA AAT GO A GGfc ACA TGT GTG TCC AAC AAG TAC TTC TCC AAC ATT 95 
Cys Leu Asn Gly Gly Thr Cys Val Ser Asn Lys Tyr Phe Ser Asn lie 
20 25 30 



CAC TGG TGC AAC TGC CCA AAG AAA TTC GGA GGG CAG CAC TGT GAA ATA 143 
His Trp Cys Asn Cys Pro Lys Lys Phe Gly Gly Gin His Cys Glu lie 
35 40 45 



GAT AAG TCA AAA ACC TGC TAT GAG GGG AAT GGT CAC TTT TAC CGA GGA 191 
Asp Lys Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly 
50 55 50 



AAG GCC AGC ACT GAC ACC ATG GGC CGG CCC TGC CTG COC TGG AAC TCT 239 
Lys Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser 
65 70 75 



GCC ACT GTC CTT CAG CAA ACG TAC CAT GCC CAC AGA TCT GAT GCT CTT 287 
Ala Thr Val Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu 

35 90 95 



80 



CAG CTG GGC CTG GGG AAA CAT AAT TAC TGC AGG AAC CCA GAC AAC CGG 335 
Gin Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg 
^100 105 110 



AGG CGA CCC TGG TGC TAT GTG CAG GTG GGC CTA AAG CCG CTT GTC CAA 383 
Arg Arg Pro Trp Cys Tyr Val Gin Val Gly Leu Lys Pro Leu Val Gin 
115 120 125 
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GAG TGC ATG GTG CAT GAC TGC GCA GAT GGA AAA TAAGCTT 423 
Glu Cys Met Val His Asp Cys Ala Asp Gly Lys 
130 135 



(2) INFORMATION POUR LA SEQ ID NO: 4: I 
(i) CARACTERISTIQUES DE LA SEQUENCE: 

10 (A) LONGUEUR: 541 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

15 (ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON , 
(iii) ANTI-SENS: NON 

20 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..S36 

25 (D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAFU3.CSF" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 



30 CC TTA GGC TTA ACC CCC CTG GGC CCT GCC AGC TCC CTG CCC CAG AGC 47 

Leu Gly Leu Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gin Ser 
1 5 10 15 



35 TTC CTG CTC AAG TGC TTA GAG CAA GTG AGG AAG ATC CAG GGC GAT GGC 95 
Phe Leu Leu Lys Cys Leu Glu Gin Val Arg Lys lie Gin Gly Asp Gly 
20 25 30 



40 GCA GCC CTC CAG GAG AAG CTG TGT GCC ACC TAC AAG CTG TGC CAC CCC 143 

Ala Ala Leu Gin Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro 
35 40 45 



45 GAG GAG CTG GTG CTG CTC GGA CAC TCT CTG GGC ATC CCC TGG GCT CCC 191 
Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly He Pro Trp Ala Pro 
50 55 60 



CTG AGC TCC TGC CCC AGC CAG GCC CTG CAG CTG GCA GGC TGC TTG AGC 239 
50 Leu Ser Ser Cys Pro Ser Gin Ala Leu Gin Leu Ala Gly Cys Leu Ser 
65 70 75 



CAA CTC CAT AGC GGC CTT TTC CTC TAC CAG GGG CTC CTG CAG GCC CTG 287 
55 Gin Leu His Ser Gly Leu Phe Leu Tyr Gin Gly Leu Leu Gin Ala Leu 
80 85 90 95 
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10 



15 



20 



25 



30 



45 



GAA GGG ATA TCC CCC GAG TTG GGT CCC ACC TTG GAC ACA CTG CAG CTG 335 
Glu Gly He Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu 
100 105 110 



GAC GTC GCC GAC TTT GCC ACC ACC ATC TGG CAG CAG ATG GAA GAA CTG 383 
Asp Val Ala Asp Phe Ala Thr Thr He Trp Gin Gin Met Glu Glu Leu 
115 120 125 



GGA ATG GCC CCT GCC CTG CAG CCC ACC CAG GGT GCC ATG CCG GCC TTC 431 
Gly Met Ala Pro Ala Leu Gin Pro Thr Gin Gly Ala Met Pro Ala Phe 
130 135 140 



GCC TCT GCT TTC CAG CGC CGG GCA GGA GGG GTC CTG GTT GCT AGC CAT 479 
Ala Ser Ala Phe Gin Arg Arg Ala Gly Gly Val Leu Val Ala Ser His 
145 150 155 



CTG CAG AGC TTC CTG GAG GTG TCG TAC CGC GTT CTA CGC CAC CTT GCG 527 
Leu Gin Ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala 
160 165 170 175 



CAG CCC TGAAGCTT 543 
Gin Pro 



(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

35 (A) LONGUEUR: 2455 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

40 (ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 
(ix) CARACTERISTIQUE ADDITIONELLE: 



(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 26..2389 

50 (D) AUTRES RENSEIGNEMENTS: /product "Chimera G.CSF-Gly4-SAH en aval region prepro de SAH" 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc_recomb 
55 (B) EMPLACEMENT: 620..631 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Linker PolyGly" 

(ix) CARACTERISTIQUE ADDITIONELLE: 
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(A) NOM/CLE: misc feature | 

(B) EMPLACEMENT: 106..111 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Apa I" 
5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

AAGCTTTACA ACAAATATAA AAACA ATG AAG TGG GTA ACC TTT ATT TCC CTT 52 

Met Lys Trp Val Thr Phe lie Ser Leu 
1 S 

10 



TTT TTT CTC TTT AGC TCG GCT TAT TCC AGG GGT GTG TTT CGT CGA ACC 100 

f5 



CTT TTT XTi av^u i\_v» w^r- — ~ - - - — — LIC 

Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Gly Val Phe Arg Arg Thr 
10 15 20 25 



CCC CTG GGC CCT GCC AGC TCC CTG CCC CAG AGC TTC CTG CTC AAG TGC 148 

Pro Leu Gly Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu Lys Cys 
30 35 40 

20 



TTA GAG CAA GTG AGG AAG ATC CAG GGC GAT GGC GCA GCG CTC CAG GAG 196 
Leu Glu Gin Val Arg Lys lie Gin Gly Asp Gly Ala Ala Leu Gin Glu 
45 50 55 

25 

AAG CTG TGT GCC ACC TAC AAG CTG TGC CAC CCC GAG GAG CTG GTG CTG 244 
Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu 
60 65 70 

30 

CTC GGA CAC TCP CTG GGC ATC CCC TGG GCT CCC CTG AGC TCC TGC CCC 292 
Leu Gly His Ser Leu Gly He Pro Trp Ala Pro Leu Ser Ser Cys Pro 
75 80 85 

35 



40 



AGC CAG GCC CTG CAG CTG GCA GGC TGC TTG AGC CAA CTC CAT AGC GGC 
Ser Gin Ala Leu Gin Leu Ala Gly Cys Leu Ser Gin Leu His Ser Gly 
90 95 100 105 



340 



45 

CTT TTC CTC TAC CAG GGG CTC CTG CAG GCC CTG GAA GGG ATA TCC CCC 388 
Leu Phe Leu Tyr Gin Gly Leu Leu Gin Ala Leu Glu Gly He Ser Pro 
110 115 120 

50 

GAG TTG GGT CCC ACC TTG GAC ACA CTG CAG CTG GAC GTC GCC GAC TTT 436 
Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu Asp Val Ala Asp Phe 
125 130 135 

55 

GCC ACC ACC ATC TGG CAG CAG ATG GAA GAA CTG GGA ATG GCC CCT GCC 484 
Ala Thr Thr lie Trp Gin Gin Met Glu Glu Leu Gly Met Ala Pro Ala 
140 145 150 
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10 



15 



20 



CTG CAG CCC ACC CAG GGT GCC ATG CCG GCC TTC GCC TCT GCT TTC CAG 532 
Leu Gin Pro Thr Gin Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gin 
155 160 165 



CGC CGG GCA GGA G<3G GTC CTG GTT GCT AGC CAT CTG CAG AGC TTC CTG 580 
Arg Arc Ala Gly Gly Val Leu Val Ala Ser His Leu Gin Ser Phe Leu 
170 " 175 180 185 



GAG GTG TCG TAC CGC GTT CTA CGC CAC CTT GCG CAG CCC GGT GGA GGC 628 
Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gin Pro Gly Gly Gly 
190 195 200 



GGT GAT GCA CAC AAG AGT GAG GTT GCT CAT CGG TTT AAA GAT TTG GGA 676 
Gly Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly 
205 210 215 



25 



30 



35 



40 



45 



GAA GAA AAT TTC AAA GCC TTG GTG TTG ATT GCC TTT GCT CAG TAT CTT 724 
Glu Glu Asn Phe Lys Ala Leu Val Leu He Ala Phe Ala Gin Tyr Leu 
220 225 230 



CAG CAG TGT CCA TTT GAA GAT CAT GTA AAA TTA GTG AAT GAA GTA ACT 772 
Gin Gin Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr 
235 240 245 



GAA TTT GCA AAA ACA TGT GTT GCT GAT GAG TCA GCT GAA AAT TGT GAC 820 
Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp 
250 255 260 265 



AAA TCA CTT CAT ACC CTT TTT GGA GAC AAA TTA TGC ACA GTT GCA ACT 868 
Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr 
270 275 280 



CTT CGT GAA ACC TAT GGT GAA ATG GCT GAC TGC TGT GCA AAA CAA GAA 916 
Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gin Glu 
285 290 295 



CCT GAG AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC CCA AAC 964 
Pro Glu Arg Asn Glu Cys Phe Leu Gin His Lys Asp Asp Asn Pro Asn 
300 305 310 

50 

CTC CCC CGA TTG GTG AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT 1 01 2 

Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe 
315 320 325 

55 
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10 



15 



20 



25 



30 



35 



CAT GAC AAT GAA GAG ACA TTT TTG AAA AAA TAC TTA TAT GAA ATT GCC 1060 
His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tvr Leu Tyr Glu He Ala 
330 335 340 345 



AGA AGA CAT CCT TAC TTT TAT GCC CCG GAA CTC CTT TTC TTT GCT AAA 1 1 08 
Ara Ara His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys 
350 355 360 



AGG TAT AAA GCT GCT TTT ACA GAA TGT TGC CAA GCT GCT GAT AAA GCT 1 1 56 

Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gin Ala Ala Asp Lys Ala 
365 370 375 



GCC TGC CTG TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA GGG AAG GCT 1204 
Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala 
380 385 390 



TCG TCT GCC AAA GAG AGA CTC AAG TGT GCC AGT CTC CAA AAA TTT GGA 1252 
Ser Ser Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly 
395 400 405 



GAA AGA GCT TTC AAA GCA TGG GGA GTA GCT CGC CTG AGC CAG AGA TTT 1300 
Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gin Arg Phe - 
410 415 420 425 



CCC AAA GCT GAG TTT GCA GAA GTT TCC AAG TTA GTG ACA GAT CTT ACC 1348 
Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr 
430 435 440 



40 



45 



AAA GTC CAC ACG GAA TGC TGC CAT GGA GAT CTG CTT GAA TGT GCT GAT 1 396 
Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp 
445 450 455 



GAC AGG GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT TCG ATC 1444 
Asp Arg Ala Asp Leu Ala Lys Tyr lie Cys Glu Asn Gin Asp Ser He 
460 465 470 



TCC AGT AAA CTG AAG GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC 1492 
Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser 
475 480 485 

CAC TGC ATT GCC GAA GTG GAA AAT GAT GAG ATG CCT GCT GAC TTG CCT 1540 
His Cys He Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro 
490 495 500 505 

55 

TCA TTA GCT GCT GAT TTT GTT GAA AGT AAG GAT GTT TGC AAA AAC TAT 1588 
Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr 
510 515 520 
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10 



15 



20 



GCT GAG GCA AAG GAT GTC TTC CTG GGC ATG TTT TTG TAT GAA TAT GCA 1636 
Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala 
525 530 535 



AGA AGG CAT CCT GAT TAC TCT GTC GTA CTG CTG CTG AGA CTT GCC AAG 1684 
Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys 
540 545 550 



ACA TAT GAA ACC ACT CTA GAG AAG TGC TGT GCC GCT GCA GAT CCT CAT 1732 
Thr Tvr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His 
555 560 565 



GAA TGC TAT GCC AAA GTG TTC GAT GAA TTT AAA CCT CTT GTG GAA GAG 1780 
Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu 
570 575 580 585 



CCT CAG AAT TTA ATC AAA CAA MT TGT GAG CTT TTT GAG CAG CTT GGA 1828 
25 Pro Gin Asn Leu lie Lys Gin Asn Cys Glu Leu Phe Glu Gin Leu Gly 

590 595 600 



GAG TAC AAA TTC CAG AAT GCG CTA TTA GTT CGT TAC ACC AAG AAA GTA 1 876 

n Glu Tyr Lys Phe Gin Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val 
60S 610 615 



CCC CAA GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC CTA GGA 1924 
Pro Gin Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly 
35 620 625 630 



40 



AAA GTG GGC AGC AAA TGT TGT AAA CAT CCT GAA GCA AAA AGA ATG CCC 
Lvs Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro 
635 640 645 



1972 



TGT GCA GAA GAC TAT CTA TCC GTG GTC CTG AAC CAG TTA TGT GTG TTG 2020 
Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu 
45 650 655 660 665 



CAT GAG AAA ACG *£CA GTA AGT GAC AGA GTC ACC AAA TGC TGC ACA GAA 2068 
His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu 
50 670 675 680 



TCC TTG GTG AAC AGG CGA CCA TGC TTT TCA GCT CTG GAA GTC GAT GAA 21 16 
Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu 
55 685 690 695 
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10 



15 



20 



25 



30 



35 



50 



ACA TAC GTT CCC AAA GAG TTT AAT GCT GAA ACA TTC ACC TTC CAT GCA 2164 
Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala 
700 705 710 



GAT ATA TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT 2212 
Asp lie Cys Thr Leu Ser Glu Lys Glu Arg Gin lie Lys Lys Gin Thr 
715 720 725 



l 

GCA CTT GTT GAG CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA 2260 
Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin 
730 735 740 745 



CTG AAA GCT GTT ATG GAT GAT TTC GCA GCT TTT GTA GAG AAG TGC TGC 2308 
Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys 
750 755 760 



AAG GCT GAC GAT AAG GAG ACC TGC TTT GCC GAG GAG GGT AAA AAA CTT 2356 
Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu 
765 770 775 



GTT GCT GCA AGT CAA GCT GCC TTA GGC TTA TAACATCACA TTTAAAAGCA 2406 
val Ala Ala Ser Gin Ala Ala Leu Gly Leu 
780 785 



TCTCAGCCTA CCATGAGAAT AAGAGAAAGA AAATGAAGAT CAAAAGCTT 2455 



(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

40 (A) LONGUEUR: 756 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

45 (ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 
(ix) CARACTERISTIQUE ADDITIONELLE: 



(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..752 

55 (D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-Fv" 

(ix) CARACTERISTIQUE ADDITIONELLE: 
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(A) NOM/CLE: misc recomb 

(B) EMPLACEMENT: 384..428 

(D) AUTRES RENSEIGNEMENTS: /standard name= Tinker synthetique" 
5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 



CC TTA GGC TTA CAG GTG CAG CTC GAG CAG TCT GGA CCT GAG CTG GTG 47 
Leu Gly Leu Gin Val Gin Leu Glu Gin Ser Gly Pro Glu Leu Val 
1 5 10 15 

AAG CCT GGG GCC TCA GTG AAG ATT TCC TGC AAA GCT TCT GGC TAC GCA 95 
Lys Pro Gly Ala Ser Val Lys lie Ser Cys Lys Ala Ser Gly Tyr Ala 
20 25 30 

15 



20 



25 



30 



40 



45 



50 



55 



TTC AGT AGG TCT TGG ATG AAC TGG GTG AAG CAG AGG CCT GGA CAG GGT 143 
Phe Ser Arg Ser Trp Met Asn Trp Val Lys Gin Arg Pro Gly Gin Gly 
35 40 45 



CTT GAG TGG ATT GGA CGG ATT TAT CCT GGA GAT GGA GAT ACC AAA TAC 191 
Leu Glu Trp lie Gly Arg lie Tyr Pro Gly Asp Gly Asp Thr Lys Tyr 
50 55 60 



AAT GGG AAG TTC AAG GGC AAG GCC ACA CTG ACT GCG GAC AGA TCA TCC 239 
Asn Gly Lys Phe Lys Gly Lys Ala Thr Leu Thr Ala Asp Arg Ser Ser 
65 * 70 75 



AGC ACA GCC TAC ATG CAG CTC AGC AGC CTG ACC TCT GTG GGC TCT GCG 287 
Ser Thr Ala Tyr Met Gin Leu Ser Ser Leu Thr Ser Val Gly Ser Ala 
80 * 85 90 95 



GTC TAT TTC TGT GCA AAA GAG AAC AAT AGG TTC GAC GAG AGG GGT TAC 335 
Val Tyr Phe Cys Ala Lys Glu Asn Asn Arg Phe Asp Glu Arg Gly Tyr 
2 100 105 110 



TAT GCT ATG GAC TAC TGG GGC CAA GGG ACC ACG GTC ACC GTC TCC TCA 383 
Tyr Ala Met Asp Tyr Trp Gly Gin Gly Thr Thr Val Thr Val Ser Ser 
115 120 125 



GGT GGC GGT GGC TCG GGC GGT GGT GGG TCG GGT GGC GGC GGA TCT AAC 431 
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asn 
130 135 140 



ATT CAG TTG ACC CAG TCT CCA AAT TCC ATG TCC ACA TCA GTA GGA GAC 479 
He Gin Leu Thr Gin Ser Pro Asn Ser Met Ser Thr Ser Val Gly Asp 
145 150 155 
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10 



15 



20 



25 



AGG GTC AGC ATC ACC TGC AAG GCC AGT CAG GAT GTG GAT ACT TCT GTA 527 
Aro Val Ser He Thr Cys Lys Ala Ser Gin Asp Val Asp Thr Ser Val 
160 165 170 175 



GCC TGG TAT CAA CAG AAA CCA GGG CAA TCT CCT AAA CTA CTG ATT TAC 575 
Ala Tro Tyr Gin Gin Lys Pro Gly Gin Ser Pro Lys Leu Leu He Tyr 
180 185 190 



I 

TGG GCA TCC ACC CGG CAC ACT GGA GTC CCT GAT CGC TTC ACA GGC AGT 623 
Trp Ala Ser Thr Arg His Thr Gly Val Pro Asp Arg Phe Thr Gly Ser 
195 200 205 



GGA TCT GGG ACA GAT TTC ACT CTC ACC ATT AGC AAT GTG CAG TCT GAA 671 
Glv Ser Gly Thr Asp Phe Thr Leu Thr He Ser Asn Val Gin Ser Glu 
210 * 215 220 



GAC TCG GCA GAT TAT TTC TGT CAG CAA TAT AGC AGC TAT CCG TGG ACG 719 
Asp Ser Ala Asp Tyr Phe Cys Gin Gin Tyr Ser Ser Tyr Pro Trp Thr- 
225 230 235 



TTC GGT GGA GGG ACC AAG CTG GAG ATC AAA TAAGCTT 759 
Phe Gly Gly Gly Thr Lys Leu Glu He Lys 
240 245 250 



30 



Revendications 

35 1. Polypeptide recombinant comportant une partie active derivee d'un polypeptide ayant une activite therapeutique, 
genetiquement couplee a une albumine ou a un variant de I'albumine, ledit variant de I'albumin conservant une 
haute demie-vie plasmatique, caracterise en ce que le polypeptide ayant une activite therapeutique est choisi 
parmi des hormones, des interferons, des interleukines, erythropoietine, G-CSF et I'insuline. 

40 2. Polypeptide selon la revendication 1 caracterise en ce que le polypeptide ayant une activite therapeutique est 
un polypeptide d'origine humaine. 

3. Polypeptide selon I'une des revendications 1 ou 2 caracterise en ce que la partie active presente une structure 
choisie parmi: 

45 

(a) la structure peptidique entiere ou, 

(b) un fragment de (a) ou une structure derivee de (a) par modification structural (mutation, substitution 
addition et/ou deletion d'un ou plusieurs residus) et conservant une activite therapeutique. 

50 4. Polypeptide selon I'une des revendications 1 a 3 caracterise en ce que I'albumine ou le variant de I'albumine 
possede une structure choisi parmi: 

(a) I'albumine mature; 

(b) I'albumine; et 

55 ( C ) une structure derivee de (a) ou (b) par modification structurale (mutation, substitution, addition et/ou de- 

letion d'un ou plusieurs residus) et conservant une haute demie-vie plasmatique. 

5. Polypeptide selon I'une des revendications 1 a 4 caracterise en ce que le polypeptide comprend une methionine 
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N-terminale. I 

6. Polypeptide selon rune des revendications 1 a 5 caracterise en ce que le polypeptide comprend un peptide de 
jonction. 

7. Polypeptide selon Tune des revendications 1 a 6 caracterise en ce que le polypeptide comprend un signal de . 
secretion. 

8. Polypeptide selon la revendication 7 caracterise en ce que le signal de secretion est la sequence signal naturelle 
du polypeptide biologiquement actif. 

9. Polypeptide selon I'une des revendications 1 a 8 caracterise en ce que la partie active est couplee a I'extremite 
N-terminale de I'albumine. 

10. Polypeptide selon Tune des revendications 1 a 8 caracterise en ce que la partie active est couplee a I'extremite 
C-terminale de I'albumine. 

i 

1 1 . Polypeptide selon Tune des revendications 1 a 1 0 caracterise en ce que la partie active y est represents plusieurs 
fois. 

12. Sequence nucleotidique codant pour un polypeptide selon Tune quelconque des revendications 1 a 11. 

13. Sequence nucleotidique selon la revendication 12 caracterisee en ce qu'elle comprend une sequence codant 
pour une sequence "leader" permettant la secretion du polypeptide exprime. 

14 Cassette d'expression comprenant une sequence nucleotidique selon Tune des revendications 12 ou 13 sous le 
controle d'une region d'initiation de la transcription et eventuellement d'une region de terminaison de la transcnp- 
tion. 

15. Plasmide autoreplicatif comportant une cassette d'expression selon la revendication 14. 

16 Cellule recombinante eucaryote ou procaryote dans laquelle a ete insere une sequence nucleotidique selon Tune 
des revendications 12 ou 13 ou une cassette d'expression selon la revendication 14 ou un plasmide selon la 
revendication 15. 

17. Cellule recombinante selon la revendication 16 caracterisee en ce qu'il s'agit d'une levure, d'une cellule animale, 
d'un champignon ou d'une bacterie. 

18. Cellule recombinante selon la revendication 17 caracterisee en ce qu'il s'agit d'une levure. 

19. Cellule recombinante selon la revendication 18 caracterisee en ce qu'il s'agit d'une levure du genre Saccharo- 
myces ou Kluyveromyces. 

20 Procede de preparation d'un polypeptide tel que defini dans Tune des revendications 1 a 11 caracterise en ce 
que Ton cultive une cellule recombinante selon I'une des revendications 16 a 19 dans des conditions d'expression, 
et on recupere le polypeptide produit. 

21. Composition pharmaceutique comprenant un ou plusieurs polypeptides selon I'une quelconque des revendications 
1 a 11 ou prepares par un precede selon la revendication 20. 

22. Composition pharmaceutique comprenant une sequence nueleotidique selon I'une quelconque des revendications 
1 2 a 14 utilisable en therapie genique. 



PatentansprCiche 



1 Rekombinantes Polypeptid mit einem von einem Polypetid mit therapeutischer Aktivitat erhaltenen aktiven Teil, 
der an ein Albumin oder eine Album in variante genetisch gekoppelt ist, wobei die Albummvanante eme groOe 
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Plasma-Halbwertszeit konserviert, dadurch gekennzeichnet, dass das Polypeptid mit therapeutischer Aktivitat 
ausgewahlt ist aus Hormonen, Interferonen, Interleukinen, Erythropoitin, G-CSF und Insulin. 

2. Polypeptid nach Anspruch 1, dadurch gekennzeichnet, dass das Polypeptid mit therapeutischer Aktivitat ein 
5 Polypeptid menschlichen Ursprungs ist. 

3. Polypeptid nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der aktive Teil eine Struktur aufweist, die 
ausgewahlt ist aus 

10 (a) einer vollstandigen Peptidstruktur oder 

(b) einem Fragment von (a) oder einer durch strukturelle Modifikation (Mutation, Substitution und/oder L6- 
schung von einem oder mehreren Rest(en)) und Konservierung der therapeutischen Aktivitat von (a) erhalte- 
nen Struktur. 

15 4. Polypeptid nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, dass das Albumin oder die Albumin- 
variante eine Struktur aufweist, die ausgewahlt ist von 

(a) reifem Albumin, 

(b) Albumin; und 

20 (c) einer von (a) oder (b) durch strukturelle Modifikation (Mutation, Substitution, Addition und/oder Loschung 

von einem oder mehreren Reten) und Konservierung der hohen Plasma-Halbwertszeit erhaltenen Struktur. 

5. Polypeptid nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, dass das Polypeptid ein N-terminales 
Methionin aufweist. 

25 

. 6. - Polypeptid nach einem der Anspriiche 1 bis 5, dadurch gekennzeichnet, dass das Polypeptid ein Linkerpeptid 

aufweist. 

7. Polypeptid nach einem der Anspruche 1 bis 6, dadurch gekennzeichnet, dass das Polypeptid ein Sekretionssi- 
30 gnal aufweist. 

8. Polypeptid nach Anspruch 7, dadurch gekennzeichnet, dass das Sekretionssignal das natiirliche Sekretionssi- 
gnal des biologisch aktiven Polypeptids ist. 

35 9. Polypeptid nach einem der Anspruche 1 bis 8, dadurch gekennzeichnet, dass der aktive Teil an den N-Terminus 
des Albumins gekoppelt ist. 

10. Polypeptid nach einem der Anspruche 1 bis 8, dadurch gekennzeichnet, dass der aktive Teil an den C-Terminus 
des Albumins gekoppelt ist. 

40 

11. Polypeptid nach einem der Anspruche 1 bis 10, dadurch gekennzeichnet, dass der aktive Teil mehrere Male 
vorhanden ist. 

12. Nukleotidsequenz, welche ein Polypeptid nach einem der Anspriiche 1 bis 11 kodiert. 

45 

13. Nukleotidsequenz nach Anspruch 12, dadurch gekennzeichnet, dass sie eine Sequenz aulweist, die eine "Fun- 
rer"-Sequenz kodiert, welche die Sekretion des expressivierten Polypeptids ermoglicht. 

14. Expressionskassette, welche eine Nukleotidsequenz nach einem der Anspruche 12 und 13 aufweist unter der 
so Kontrolle eines Transkriptionsinitiierungsbereichs und optional eines Transkriptionsbeendigungsbereiches. 

15. Selbstreplizierendes Plasmid, welches eine Expressionskassette nach Anspruch 14 aufweist. 

16. Rekombinante eukaryotische oder prokaryotische Zelle, in welche eine Nukleotidsequenz nach Anspruch 12 oder 
55 13 oder eine Expressionskassette nach Anspruch 14 oder ein Plasmid nach Anspruch 15 eingesetzt ist. 

17. Rekombinante Zelle nach Anspruch 16, dadurch gekennzeichnet, dasses sich urn eine Hefezelle, eine Tlerzelle, 
eine Pilzzelle oder eine bakterielle Zelle handelt. 
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18. Rekombinante Zelle nach Anspruch 17, dadurch gekennzeichnet, dass es sich urn eine Hefezelle handelt. 

19. Rekombinante Zelle nach Anspruch 18, dadurch gekennzeichnet, dass es sich um eine Zelle der Art Saccha- 
romyces oder Kluyveromyces handelt. 

5 

20. Verfahren zur Herstellung eines Polypeptides gemafc einem der Anspruche 1 bis 11 , dadurch gekennzeichnet, 
dass eine rekombinante Zelle nach einem der Anspruche 16 bis 19 unter Expressionsbedingungen kultiviert wird 
und dass das Polypeptidprodukt geborgen wird. 

10 21. Pharmazeutische Zusammensetzung mit einem oder mehreren Polypeptiden nach einem der Anspruche 1 bis 11 
oder hergestellt durch ein Verfahren nach Anspruch 20. 

22. Pharmazeutische Zusammensetzung mit einer Nukleotidsequenz nach einem der Anspruche 12 bis 14, welche 
in der Gentherapie einsetzbar ist. 

15 

Claims 

1. A recombinant polypeptide comprising an active part derived from a polypeptide having a therapeutic activity, 
20 genetically coupled to an albumin or a variant of albumin, wherein the variant of albumin conserves a high plasma 

half-life, characterised in that the polypeptide having a therapeutic activity is chosen from among hormones, 
interferons, interleukins, erythropoietin, G-CSF and insulin. 

2. A polypeptide according to Claim 2 characterised in that the polypeptide having a therapeutic activity is a polypep- 
25 tide of human origin. 

3. A polypeptide according to Claim I or 2 characterised in that the active part has a structure chosen from 

(a) an entire peptide structure or 

30 

(b) a fragment of (a) or a structure derived from (a) by structural modification (mutation, substitution, and/or 
deletion of one or more residues) and conservation of therapeutic activity. 

4. A polypeptide according to one of Claims 1 to 3 characterised in that the albumin or albumin variant has a structure 
35 chosen from: 

(a) mature albumin; 

(b) albumin; and 

40 

(c) a structure derived from (a) or (b) by structural modification (mutation, substitution, addition and/or deletion 
of one or more residues) and conserving a high plasma half-life. 

5. A polypeptide according to one of Claims 1 to 4 characterised in that the polypeptide comprises an N-terminal 
45 . methionine. 

6. A polypeptide according to one of Claims 1 to 5 characterised in that the polypeptide comprises a linker peptide. 

7. A polypeptide according to one of Claims 1 to 6 characterised in that the polypeptide comprises a secretion signal. 

50 

8. A polypeptide according to Claim 8 characterised in that the secretion signal is the natural secretion signal of 
the biologically active polypeptide. 

9. A polypeptide according to one of Claims 1 to 8 characterised in that the active part is coupled to the N-terminus 
55 of the albumin. 

10. A polypeptide according to one of Claims 1 to 8 characterised in that the active part is coupled to the C-terminus 
of the albumin. 
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1 1 . A polypeptide according to one of Claims 1 to 1 0 characterised in that the active part is represented several times. 

12. Nucleotide sequence encoding a polypeptide according to one of Claims 1 to 11. 

13. A nucleotide sequence according to Claim 12 characterised in that it comprises a sequence encoding a "leader- 
sequence permitting the secretion of the expressed polypeptide. 

14. An expression cassette comprising a nucleotide sequence according to one of Claims 12 and 13 under the control 
of a transcription initiation region and optionally a transcription termination region. 

15. A self-replicating plasmid comprising an expression cassette according to Claim 14. 

16. A recombinant eukaryotic or prokaryotic cell in which has been inserted a nucleotide sequence according to Claim 
12 or 13 or an expression cassette according to Claim 14 or a plasmid according to Claim 15. 

17. A recombinant cell according to Claim 16 characterised in that it is a yeast, animal, fungal or bacterial cell. 

I 

18. A recombinant cell according to Claim 1 7 characterised in that it is a yeast cell. 

19. A recombinant cell according to Claim 18 characterised in that it is a cell from the genus Saccharomyces or 
Kluyveromyces. 

20. A process for preparing a polypeptide as defined in one of Claims 1 to 11 characterised in that one cultivates a 
recombinant cell according to one of Claims 16to 19 under conditions for expression and one recovers the polypep- 
tide product. 

21. A pharmaceutical composition comprising one or more polypeptides according to Claims 1 to 11 or prepared by a 
process according to Claim 20. 

22. A pharmaceutical composition comprising a nucleotide sequence according to one of Claims 12 to 14 usable in 
gene therapy. 
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SEP, HP NO; 1 



AAGCT TTACAACAAA TATAAAAACA ATG AAG TOG GTA ACC TTT ATT TCC CTT CTT TTT CTC TTT 

Met Lys Trp Val Thr Phe lie Ser Leu Leu Phe Leu Phe -12 

AGC ICG OCT TAT TCC AGG GCT GTG TTT CGT CCA GAT OCA CAC AAG ACT GAG GTT OCT CAT 

Ser ser Ala Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser.Glu Val Ala His 9 

CGG TTT AAA GAT TTG GGA GAA GAA AAT TTC AAA OCC TTG GTG TTG ATT OCC TTT OCT CAG 

Arg Phe. lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu He Ala Phe Ala Gin 29 

TAT CTT CAG CAG TGT CGA TTT GAA GAT CAT GTA AAA TTA GTG AAT GAA GTA ACT GAA TTT 

tyr Leu Gin Gin Cys Pro Phe Glu Asp His Val Lys Leu val Asn Glu Val Thr Glu Phe 49 

OCA AAA ACA TGT GTT GCT GAT GAG TCA OCT GAA AAT TGT GAC AAA TCA CTT CAT ACC CTT 

Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp lys Ser Leu His Thr Leu 69 

TTT GGA GAC AAA TTA TOC ACA GTT GCA ACT CTT CGT GAA ACC TAT GGT GAA ATG OCT GAC 

Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp 89 

TCC TGT GCA AAA CAA GAA OCT GAG AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC 

cys Cys Ala Lys Gin Glu Pro Glu Arg Asn Glu Cys Phe Leu Gin His lys Asp Asp Asn 109 

OCA AAC CTC CCC CGA TTG GTG AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT CAT GAC 

Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met cys Thr Ala Phe His Asp 129 



AAT GAA GAG ACA TTT TTG AAA AAA TAC TTA TAT GAA ATT GOC AGA AGA CAT OCT TAC TTT 
Asn Glu Glu Thr Phe Leu Lys* Lys Tyr Leu Tyr Glu He Ala Arg Arg His Pro Tyr Phe. 

TAT OCC COG GAA CTC CTT TTC TTT GCT AAA AGG TAT AAA GCT GCT TTT ACA GAA TGT TGC 
iyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr lys Ala Ala Phe Thr Glu Cys Cys 



149 



169 



CAA GCT GCT GAT AAA GCT OCC TGC CTC TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA GGG 

Gin Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly 189 

AAG GCT TOG TCT GOC AAA CAG AGA CTC AAG TGT GOC ACT CTC CAA AAA TTT GGA GAA AGA 

Lys Ala Ser Ser Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Cly Glu Arg 209 

GCT TTC AAA GCA TOG GCA GTA GCT CGC CTC AGC CAG AGA TTT CCC AAA GCT GAG TTT GCA 

Ala Phe . Lys Ala Trp Ala val Ala Arg Leu Ser Gin Arg Phe Pro Lys Ala Glu Phe Ala 229 

GAA GTT TCC AAG TTA GTG ACA GAT CTT ACC AAA GTC CAC AGG GAA TGC TGC CAT GGA GAT 

Glu Val Ser Lys Leu val Thr Asp Leu Thr Lys val His Thr Glu Cys Cys His Gly Asp 249 

Figure 2(a) 
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Figure 4A 



rr TTA GGC TTA (NNN)244 TftA flCTT 

Leu Gly Leu <Thr470->Val7l3> *** 



CC TTA GGC TTA . (NNN) 29 TAA QCTT Figure 4B 

. Leu Gly Leu <Thr470->Asp498) 
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Figure 4D 



Figure 4 (A & D) 
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SEC, IP NO; 2 



CC TTA GGC TTA ACC TGT GAA GOC TGC CAG GAG OCC GGA GGC CTG GTQ GTG OCT COC ACA 

Leu Gly Lea Ifcr cys Glu Ala cys Gin Glu Pro Gly Gly Leu Val Val Pro Pro Thr 601 

SAH< 1 >VWF4?0-»713 

GAT GCC COG GTG AGC COC ACC ACT CTG TAT GTG GAG GAC ATC TOG GAA COG COG TTG CAC 

Asp Ala Pro val Ser Pro Thr Thr L£ii Tyr Val Glu ten lie Ser Glu £eq Pro Leu His 621 



GAT TIC TAC TGC AGC AGG CTA CTG GAC CTG GTC TTC CTG CTG GAT GGC TGC TOO MS CTG 
Asp Phe Xxx. cys ser Arg Leu Leu Asp Leu Val Phe Leu Leu Asp Gly Ser sex Arg Leu 



ATC GGG CTC AAG GAC CGG AAG CGA OCG TCA GAG CTG CGG OGC ATT GOC AGC CAG GTG AAG 
lie Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg He Ala Ser Gin Val Lys 



GAG AAG CAG GOC OCT GAG AAC.AAG GOC TTC GTG CTG -AGC ACT GTG GAT GAG CTG GAG CAG 
Glu Lys Gin Ala Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val Asp Glu Leu Glu Gin 

CAA AGG GAC GAG ATC GTT AGC TAC CTC TGT GAC CTT GCC OCT GAA GOC OCT OCT OCT ACT 
Gin Arg Asp Glu He Val Ser Tyr Jteu Cys Asp Leu Ala Pro Glu Ala Pro Pro £EQ Thr 

CTG COC CCC GAC ATC OCA CAA GTC TAA GCTT 
Leu Pro £cp. Asp Mec Ala Gin Val *** 



641 



TCC GAG OCT GAG TTT GAA GTG CTG AAG GCC TTT GTG CTG GAC ATG ATG GAG 003 CTG COC 

Ser Glu Ala Glu Phe Glu Val Leu lys Ala Phe val V*l Asp Met Mec Glu Arg Leu Arg 661 

ATC TOC CAG AAG TOG GTC OQC GTG GOC GTG GTG GAG TAC CAC GAC GGC TOC CAC GOC TAC 

He Ser Gin Lys Trp Val Arg Val Ala val Val Glu Tyr His Asp Gly Ser His Ala Tyr 681 



701 



TAT GOG GGC AGC. CAG GTG GOC TOC AOC AGC GAG GTC TTG AAA TAC ACA CTG TTC CAA ATC 

Tyr Ala Gly Ser Gin Val Ala Ser Thr Ser Glu Val Leu Lys lyr Thr Leu Phe Gin He 721 

TIC AGC AAG ATC GAC COC CCT GAA GCC TOC OGC ATC GOC CTG CTC CTG ATG GOC AGC CAG 

Phe Ser Lys He Asp Arg Pro Glu Ala Ser Arg He Ala Leu Leu Leu Met Ala Ser Gin 741 

GAG COC CAA CGG ATG TCC CGQ AAC TTT GTC OGC TAC GTC CAG GOC CTG AAG AAG AAG AAG 

Glu Pro Gin Arg Mec Ser Arg Asn Phe val Arg Tyr Val Gin Gly Leu Lys lys Lys Lys 761 

GTC ATT GTG ATC COG GTG GGC ATT GGG COC CAT GOC AAC CTC AAG CAG ATC OGC CTC ATC 

Val He Val He Pro Val Gly He Gly Pro His Ala Asn Leu lys Gin He Arg Leu He 781 



801 



821 



829 



Figure 4 (E) 
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Figure 6 
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Figure 7 
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I 

I 



<sgQ fl ID NO; 3 



OC TTA GGC TTA AGC AAT GAA CTT CAT CAA GTT OCA TOG AAC TGT GAC TGT CTA AAT GGA 

Leu Gly Leu Ser Asn Glu Leu His Gin val Fro Ser Asn Cys Asp Cys Leu Asn Gly 
s\H< 1 >UK 

GGA ACA TGT GTG TCC AAC AAG TAC TIC TOC AAC ATT CAC TGQ TGC AAC TQC OCA AAG AAA 
Gly Thr Cys Val Ser Asn Lys *iyr Phe ser Asn He His Trp Cys Asn Cys Pro lys Lys 

TTC GGA GGG CAG CAC TGT GAA ATA GAT AAG TCA AAA AOC TGC TAT GAG GOG AAT GGT CAC 
Phe Gly Gly Gin His Cys Glu He Asp Lys Ser lys Thr cys lyr Glu Gly Asn Gly His 

BGF-LXKX<- — I — - > KRINGLB 

rrr tac cga gga aag goc agc act gac acc atg ggc cog coc tgc ctg ooc tog aac tct 
Phe Tyr Arg Gly Lys Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser 

GCC ACT GTC CTT CAG CAA ACG TAC CAT GCC CAC AGA TCT GAT OCT CTT CAG CTC GGC CTG 
Ala Thr Val Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu Gin Leu Gly Leu 

GGG AAA CAT AAT TAC TGC AGG AAC OCA GAC AAC COG AGG CGA COC TOG TGC TAT CTG CAG 
Gly Lys His Asn Tyr cys Arg Asn Pro Asp Asn Arg Arg Arg Pro Trp Cys Tyr Val Gin 

GTG GGC CTA AAG CCG CTT GTC CAA GAG TGC ATG GTG CAT GAC TOC GCA GAT GGA AAA TAA 
Val Gly Leu Lys Pro Leu Val Gin Glu Cys Met val His Asp Cys Ala Asp Gly Lys *♦* 

Gcrr 



Figure 8 
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Figure 9 
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STO. IP NO ; 4 



ApaX 

OC TTA GOC TTA AOC COC CTR GGC CCT GOC AGC TOC CTG CCC CAG AGC TTC CTG CTC AAG 

Leu Gly Leu Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu Lys 601 

SAH< 1 »<3-CSF 

TOC TTA GAG CAA GTG AQG AAG ATC CAG GOC GAT GOC OCA GOG CTC CAG GAG AAG CTG TGT 

Cys Leu Glu Gin Val Arg Lys He Gin Gly Asp Gly Ala Xla Leu Gin Glu Lys Leu Cys 621 

GOC AOC TAC AAG CTG TGC CAC CCC GAG GAG CTG GTG CTG CTC GGA CAC TCT CTG GGC ATC 

Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu val Leu Leu Gly His Ser Leu Gly lie 641 



SfltX 

CCC TOG GCT COC C Tp AGC TO C TGC COC AGC CAG GOC CTG CAG CTC GCA GGC TGC TTG AGC 
Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gin Ala Leu Gin Leu Ala Gly Cys Leu Ser 



661 



CAA CTC CAT AGC GGC CTT TTC CTC TAC CAG GOG CTC CTG CAG GOC CTG GAA GGG ATA TOC 

Gin Leu His Ser Gly Leu Phe Leu Tyr Gin Gly Leu Leu Gin Ala Leu Glu Gly He Ser 6B1 

CCC GAG TTG GGT CCC AGC TTG GAC ACA CTG CAG CTG GAC CTC GCC GAC TTT GOC AOC ACC 

Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu Asp Val Ala Asp Phe Ala Ttir Tnr 701 

ATC TOG CAG CAG ATG GAA GAA CTG GGA ATG GCC OCT GCC CTG CAG CCC AOC CAG GGT GOC 

He Trp Gin Gin Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gin Pro Thr Gin Gly Ala 721 

ATG COG GCC TTC GOC TCT GCT TTC CAG GGC COG GCA GGA GGG GTC CTG GTT GCT AGC CAT 

Met Pro Ala Phe Ala Ser Ala Phe Gin Arg Arg Ala Gly Gly Val Leu Val Ala Ser His 741 

• CTG CAG AOC TTC CTG GAG GTG TOG TAC CGC GTT CTA GGC CAC CTT GOG CAG CCC TGA AOCTT 
Leu Gin Ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gin Pro 759 



Figure 10 
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seq, id NO; 5 



AAOCT TTACAACAAA TATAAAAACA ATG AAG TOG GTA ACC TTT ATT TCC CTT CTT TTT CTC TTT 

Met Lys Trp val Thr Phe lie Ser Leu Leu Phe Leu Phe 12 

ApaX 

AGC TOG OCT TAT TCC AGG GGT GTG TTT OGT OGA ACC COC CTG OGC OCT OCC AOC TOC CTG 
Ser Ser Ala Tyr Ser Arg Gly Val Phe Arg Arg Thr Pro Leu Gly Pro Ala Ser Ser Leu 9 

I — >cf-csr 

OCC CAG AGC TTC CTG CTC AAG TOC TTA GAG CAA GTG AGG AAG ATC CAG OGC GAT GGC GCA 

Pro Gin Ser Phe Leu Leu Lys Cys Leu Glu Gin Val Arg Lys lie Gin Gly Asp Gly Ala 29 

GCG CTC CAG GAG AAG CTC TGT GCC ACC TAC AAG CTG TGC CAC CCC GAG GAG CTC GTG CTG 

Ala Leu Gin Glu Lys Leu Cys Ala Thr Tyr Lys Leu cys His Pro Glu Glu Leu Val Leu 49 
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149 


GGG 


GTC CTG 


GTT 


GCT 


AGC 
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AGC 


TTC CTG 
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GTG 


TOG 
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GTT 
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OGC 


169 


Gly 


val Leu 
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His Leu Gin 


ser 
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CCG GAA CTC CTT TTC TTT GCT AAA AGG TAT AAA OCT GCT TTT ACA GAA TGT TGC CAA GCT 
^^SlIuPhePheAULysA^Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gin Ala 349 

GCT GAT AAA OCT GCC TGC CTG TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA GGG AAG OCT 

Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala 369 

TCG TCT OCC AAA CAG AGA CTC AAG TGT GCC ACT CTC CAA AAA TTT GGA GAA AGA GCT TTC 

ser Set- Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly Glu Arg Ala Phe 389 

AAA OCA TCG GCA GTA GCT CGC CTG AGC CAG AGA TTT <XC AAA GCT GAG TTT OCA GAA GTT 

Lys Ala Trp Ala Val Ala Arg Leu ser Gin Arg Phe Pro Lys Ala Glu Phe Ala Glu vai «o» 

ICC AAG TTA GTG ACA GAT CTT AOC AAA GTC CAC ACG GAA TGC TGC CAT GGA GAT CTG CTT 

Ser Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu cys Cys His Gly Asp Leu Leu 429 

r.hh tyt <-rr GAT GAC AGG GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT TCG ATC 

Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr lie Cys Glu Asn Gin Asp Ser lie 449 

TCC AGT AAA CTG AAG GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC CAC TGC ATT GCC 

Ser Ser Lys Leu Lys Glu Cys cys Glu lys Pro leu Leu Glu Lys Ser His Cys lie Ala 469 

nh . -,v» avp GAT GAG ATC CCT GCT GAC TIG OCT TCA TTA GCT OCT GAT TTT GTT GAA 

Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Lau Ala Ala Asp Phe Val Glu 489 

u-r RiT rrr TGC AAA AAC TAT OCT GAG OCA AAG GAT GTC TTC CTC GCC ATG TTT TTC 

Ser Lys Asp Val cys Lys Asn Tyr Ala Glu Ala Lya Asp Val Phe Lau Gly Met Phe Leu 509 

TAT GAA TAT GCA AGA AGG CAT CCT GAT TAC TCT GTC GTA CTG CTC CTG AGfc CTT GCC AAG 

Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser val Val Leu Leu Leu Arg Leu Ala Lys 529 

ACA TAT GAA ACC ACT CTA GAG AAG TCC TGT GCC OCT GCA GAT OCT CAT GAA TGC TAT CCC 

Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala 549 

AAA CTG TTC GAT GAA TTT AAA OCT CTT GTC GAA GAG CCT CAG AAT TTA ATC AAA CAA AAT 

lys Val Phe Asp Glu Phe Lys Pro Leu val Glu Glu Pro Gin Asn Leu He Lys Gin Asn 569 

TCT GAG CTT TTT GAG CAG CTT GGA GAG TAC AAA TTC CAG AAT GCG CTA TTA GTT CGT TAC 
Cys Glu Leu Phe Glu Gin Leu Gly Glu Tyr Lys Phe Gin Asn Ala Leu Leu Val Arg Tyr 



SZotXX 

GGT AAA AAA CTT GTT OCT GCA AGT CAA GCT OX TTA CGC TTA TAA CATCACATTT 
Gly Lys Lys Leu Val Ala Ala Ser Oln Ala Ala Leu Gly Leu 

AAAAGCATCT CAGCCTACCA TGAGAATAAG AGAAAGAAAA TGAAGATCAA AAGCTT 

Figure 11 (b) 
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ACC AAG AAA GTA CCC CAA GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC CTA GGA 

Thr Lys Lys Val Pro Gin Val Ser Thr Pro Thr Leu val Glu Val ser Arg Asn Leu Gly 609 

AAA GTG GGC AGC AAA TGT TGT AAA CAT CCT GAA GCA AAA AGA ATG CCC TCT CCA GAA CAC 

Lys Vol Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp 629 

TAT CTA TCC GTG GTC CTG AAC CAG TTA TCT GTG TTG CAT GAG AAA ACG OCA GTA AGT GAC 

Tyr Leu Ser Val val Leu Asn Gin Leu cys Val Leu His Glu lys Thr Pro Val Ser Asp 649 

AGS GTC AOC AAA TGC TGC ACA GAA TCC TTG GTG AAC AGG OGA CCA TCC TTT TCA OCT CTG 

Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu 669 

oaa ere GAT GAA ACA TAC GTT OCC AAA GAG TTT AAT OCT GAA ACA TTC ACC TTC CAT OCA 

Glu val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr the Thr Phe His Ala 689 

GAT ATA TQC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT GCA CTT GTT GAG 

Asp lie Cys Thr Leu Ser Glu Lys Glu Arg Gin He Lys Lys Gin Thr Ala Leu Val Glu 709 

CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA CTG AAA OCT GTT ATG GAT' GAT TTC 

2u Sai Lyt Sis £Js PrS IVs Ala Thr Lys Glu Gin Leu Lys Ala Val Met Asp Asp Phe 729 

GCA GCT TTT GTA GAG AAG TQC TGC AAG GCT GAC GAT AAG GAG AOC TGC TTT GCC GAG CAG 
Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu 

(vr«s>w 



IAS 
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Figure 12 
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Figure 13 
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ID N° i 6 



rr TTA GGC TTA CAG GIG CAG CTC GAG CAG TCT GGA CCT GAG CTG GTG AAG OCT QGG GCC 

2£ ™ Gin Val Gin Leu Giu Gin Ser Gly Pro Glu Leu Val lye Pro Gly Ala 601 
SAH< 1 >VH 

TCA GTG AAG AIT TCC TGC AAA OCT TCT GGC TAC GCA TTC AGT AGG TCT TOO ATG AAC TOT 
Ser Val Lys lie Ser Cys Lys Ala Ser Gly Tyr Ala Phe Ser Arg Ser Trp Met Asn Trp 



GAT ACC AAA TAC AAT GGG AAG TTC AAG QGC AAG GOC ACA CTG ACT GOG GAC AGA TCA TCC 
A^p Snr LysTyr £ n Gly Lys Phe Lys Gly Lys Ala Thr Leu Thr Ala Asp Arg Ser Ser 

AGC ACA GCC TAC ATG CAG CTC AGC AGC CTG ACC TCP GTG GGC TCT GOG GTC TAT TTC TGT 
Ser Thr Tyr Met Gin Leu Ser Ser Leu Thr Ser Val Gly Ser Ala Val Tyr Phe cys 

OCA AAA GAG AAC AAT AGG TTC GAC GAG AGG GGT TAC TAT GCT ATG GAC TAC TGG GGC CAA 
Ala lys Glu Asn Asn Arg Phe Asp Clu Arg Gly Tyr Tyr Ala Met Asp Tyr Trp Gly Gin 



TTC GGT GGA GGG ACC AAG CTG GAG ATC AAA TAA GCTT 
Phe Gly Gly Gly Thr Lys Leu Glu lie Lys 6«« 



621 



GTG AAG CAG AGG OCT GGA CAG GGT CTT GAG TGG ATT GGA COG ATT TAT OCT GGA GAT GGA 

Val Lys Gin Arg Pro Gly Gin Gly Leu Glu Trp lie Gly Arg lie Tyr Pro Gly Asp Gly 641 



661 



681 



701 



GGG ACC AOG GTC AOC GTC TOC TCA flrrr fiflf? OCT QGC TOG GGC GGT GGT GGG TQG OCT QQC 
Gly Thr Thr Val Thr Val Ser Ser giv Glv niv Civ Ser Civ Glv GlV Glv .Sex G*V-Gte 721 
VH< I llnJter nyntbetlquo . 

anr oga TCT AAC ATT CAG TTG ACC CAG TCT CCA AAT TOC ATG TOC ACA TCA GTA GGA GAC 
r.w c w ser Asn He Gin Leu Thr Gin Ser Pro Asn Ser Met Ser Thr Ser Val Gly Asp 741 
I >VL 

AGG GTC AGC ATC ACC TGC AAG GCC AGT CAG GAT GTG GAT ACT TCT GTA GCC TGG TAT CAA 
Arg val Ser lie Thr Cys Lys Ala Ser Gin Asp Val Asp Thr Ser Val Ala Trp Tyr Gin 

CAG AAA OCA GGG CAA TCT OCT AAA CTA CTG ATT TAC TGG GCA TOC AOC COG CAC ACT GGA 
Gin Lys Pro Gly Gin Ser Pro lys Leu Leu lie Tyr Trp Ala Ser Thr Arg His Thr Gly 

GTC OCT GAT CGC TTC ACA GGC AGT GGA TCT GGG ACA GAT TTC ACT CTC AOC ATT AGC AAT 
Val Pro Asp Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr He ser Asn 



761 



781 



801 



GTG CAG TCT GAA GAC TCG GCA GAT TAT TTC TGT CAG CAA TAT AGC AGC TAT COG TGG AOG 

val Gin ser Glu Asp Ser Ala Asp Tyr Phe Cys Gin Gin Tyr Ser Ser Tyr Pro Trp Thr 821 
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Figure 14 
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Figure 15 
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Figure 17 
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Figure 18 
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